ivoka智能语音系统

当前栏目:开题报告 更新时间:2018-09-09 责任编辑:秩名

 研究目的和意义:

研究目的:在学习使用语音识别这项前端技术时将其与一些常用的软件相结合,这样一来就大大扩展了他的使用范围,更为那些不熟悉使用电脑的老年用户提供了上网的便利,也使他们切身感受到技术的发展与实用价值。

研究意义:语音识别技术是实现人机语音通信,建立一个有听和讲能力的口语系统所必需的两项关键技术。使电脑具有类似于人一样的说话能力,是当今时代信息产业的重要竞争市场。语音识别,就是让机器通过分析和理解过程把语音信号转变为相应的文本或命令的尖端技术。语音识别是一门交叉学科,所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术与语音合成技术一同成为实现人机语音通信,建立有听和讲能力的语音系统所必需的两项关键技术。对于那些不会打字的老年用户来说只要他们对着电脑说说指定的指令就可以使用该系统了。这就是语音识别的好处。而且语音模块的使用也给用户带来切身的体验,充分体会到当代软件技术的发展。

课题研究现状:

   ivoka语音识别技术研究比较成熟,识别率也在逐步升高,但使用的场合并不多,手机上的语音功能也没多少人会用,其他方面的应用就更有限了。究其原因还是因为这项技术在融入实际运用时,入门使用的门槛太高而且大多的应用场合还都是在一些高端的设备上,一般用户根本就没机会接触到这类技术。基于此,我才有了设计这款终端ivoka语音系统。

课题研究主要内容、实施方案及创新点:

主要内容是完成以下几个方面的要求:

①完成基本的语音识别功能

②实现数据库的查询、添加、访问等操作

③实现模仿QQ的登陆注册界面的设计

④实现语音控制游戏部分

⑤实现语音控制自制播放器

⑥实现语音智能上网

实施方案:在Visual Studio2010 环境下,开发一个终端语音控制系统的过程。通过分析网络上已有的比较成熟的语音功能模块,设计出一款独具一格的,操作简单的多功能语音终端系统。设计包含了登陆界面、用户注册模块、播放器主界面、数据库管理部分设计;播放器主界面部分主要介绍了系统功能设计和网络访问及代码设计;系统实现部分说明了几个主要模块的算法,本系统界面友好,操作简单,比较实用。全程支持语音操作。

创新点:将语音识别功能融入到大众化的音乐播放器中,使得前沿技术能够为普通所使用。

课题进度安排:

2017.9.26—2017.10.24选题、定题

与老师多次商量,研究最终确定大方向

2017.10.24—2017.11.15 赵老师下达任务书

赵老师把研究的基本要求告诉我,在赵老师的指导下我进行调研、收集、阅读资料,进行资料分析,确定研究内容、意义、方法及进度安排,初步确定毕业论文(设计)的具体题目。

2017.11.16—2017.11.22  开题报告

    我在赵老师的帮助下认真做好定题的前期工作,完成开题报告

2017.11.24—2018.4.30  具体软件的编写及调试

  在开题报告的基础上,我进行软件编写。

2018.5.4—2018.5.10   撰写论文及修改

进过多次修改,最终讲论文提交给赵老师,赵老师审阅之后,又进行多次修改

主要参考文献:WWw.eeelW.com

[1] 帕罗赛斯.MFC Windows程序设计(第2版)[M] .北京:清华大学出版社,2007

[2] 侯俊杰.深入浅出MFC(第2版)[M].武汉:华中科技大学出版社,2001

[3] 孙鑫. VC++深入详解(修订版)[M].北京:人民邮电出版社,2012

[4] 佩措尔德.Windows程序设计(第5版·珍藏版)[M] .北京:清华大学出版社,2010

[5]  Stanley B. Lippman .C++ Primer中文版(第4版)[M] .北京:人民邮电出版社,2006

指导教师意见:

该学生的任务安排合理而且完成的也比较好,所不足的是有些模块虽然做成了但还不是太稳定,有些地方还需要完善。