【095】周教授
作者:十男九左      更新:2017-12-19 12:26      字数:5101

锦城大学的周传芳教授最近两天脾气很坏。

这个一辈子埋首技术领域的教授,有着这类人身上常见的执拗和顽固。

事情的起因很简单,锦城大学和锦城市公安局达成了一个合作协议,关于一个电子审讯系统的开发。

最初听闻这个事情的时候,周传芳教授还有些意动,因为学院的意思是让他来牵头做这个课题。

搞了一辈子信息学,周传芳教授显然知道开发一个中文语言识别系统的难度。特别是电子审讯系统这种非特定语音特征识别系统,算得上是一个比较大的课题了。

他甚至已经盘算好了,手底下现在的几个研究生课题,都可以暂时停掉,还要找系里借调几个人来做这个课题。

结果周传芳万万没有想到,实际上所谓的电子审讯系统课题,居然只是给一个现成的软件扩充语音库插件。

要知道一个语言识别系统,大致有几个部分。

一个是声学特征和声学模型,就是指的对声音信号的采集和编码,

其次是语音模型,就是指的系统自身的语音库。

第三就是搜索判断系统,将信号的特征码在语音库中搜索对比,从而得到准确结果的过程。

简单的来说,人类的语言一个连续的模拟信号,想要让计算机识别这个信号,必须先将时域信号转换成频域信号,进行抽样压缩,这样才能通过数字信号的模式进行传输。

举个例子来说,某人对麦克风说了一个字,系统先将这个声音信号进行抽样压缩,变成一段编码,然后这段编码才能在数字系统中传输,比如传递到声音输出模板上,然后通过已经编写好的程序,让音响发出某种频率的震动,可以近似的还原出原始的音频信号。

但是在这个过程中,整个系统只是进行了信号的抽样,压缩,编码,传输,还原几个步骤,系统传输的只是二进制码而已。

语言信号的传输非常简单,从电报电话系统发展起来,目前技术已经非常完善了。

但是语言识别系统就要复杂得多了。

就拿中文来说,假设单个字的读音是一个信号基元,首先要将每一个信号基元进行采集编码,也就是将所有汉字的读音进行采集,建立数学模型。

然后有一个语音信号进来的时候,系统抽样采集,将这个语言信号的特征码在语音库中进行对比,找到对应的汉字,这样才是语音识别。

说起来非常容易,但是实际上,每个人说话的声音频率都是不一样的,人类可以区别不同的人声,就是这个原因。

但是计算机系统就不行,比如用张三的声音做样本建立的语言库,换做李四来录入,系统就不能识别了,甚至张三本人如果感冒了,或者声带出了点什么问题,系统照样不能识别。

这就需要对数据样本进行算法优化。

同样一个字的读音,换做不同的人来采集,不同的样本中,完全跟相同的特征才能作为这个字的特征码。

很显而易见,一个有实用价值的语音识别系统,它的语音库模型,是不可能进行充分样本采集的,你总不能让全中国人都去拿着常用字目录,挨个读一遍去采集样本吧。

就算真的做到了,那这个语音库模型,就有数以万亿的样本模型,先不说语音库的储存问题,就单单是识别的过程,动用巨型计算机都没办法进行有效的判断,这样的系统是完全没有实用价值的。

所以目前的语音识别研究,都是从模糊判断上下功夫,通过算法的优化,让系统具有一定的容错率和纠错功能。

从性能上来说,就是尽量用最小的码位进行语音库中样本的编码,用最准确和简化的算法进行录入信号的采集,还有用最快捷的方式进行搜索对比得出结果。

这三点就是一个语音识别系统最核心的技术所在。

但是让周传芳教授非常气愤的时候,他最后才知道,这个电子审讯系统的课题,居然只是进行语音库插件的扩写,连算法和接口协议都是人家限定了的,甚至连语音库的模型源码都不提供,只提供了一个接口软件,方便录入信号生成样本库。

这所谓的课题说的不好听点根本就是个力气活,耗时耗力,还没有技术含量。

周传芳当时就找上了计算机院的院长,表示自己不愿意接这个项目,用他老人家的原话来说:“这个狗屁课题,连大一的本科生都可以完成的。”

结果计算机院的院长苦口婆心劝了半天,说这是市政府牵头的项目,也是跟公安系统建立良好合作关系的方式。

周传芳这种纯学术教授,说起大道理来,显然不是计算机院院长的对手,很快就败下阵来,只得捏着鼻子答应承头完成这个项目。

不过周传芳心里已经决定了,这种毫无技术含量的纯力气活,就放手让手底下的研究生去做,自己只管最后的把关签字就行了。

今年自己分到得课题经费本来就不多,也不像其他教授一样能够拉下脸皮在外面接私活,自己还好说,反正各种津贴拿着也能应付过去,但是手底下几个研究生日子都不好过,有这个项目的几万块钱经费,也能改善下生活。

即便这样安慰自己,周传芳这几天还是黑着脸,将资料扔给手底下的研究生,就整天坐在办公室生闷气。

几个研究生大约也猜到了老板心情不佳的原因,所以这两天除了抱着相关资料埋头苦读,绝不出现在老板面前,以免受池鱼之灾。

不过这天周传芳接到个电话,那头说是计算机系大一的新生,叫张小凡的。

周传芳知道对方找自己是因为什么事儿,打心底里里厌恶这种钻营的学生,不过还带教书育人这么多年,周传芳倒不至于因为心中不喜就对学生恶语相向。

既然有人打过招呼让这个新人参加这次的课题,自己还是要见见这个学生把把关,如果真的是不学无术的混蛋,就趁早打发了,最多让他挂个名字。

反正这种事情见得也不少了,年年都能遇大三大四的本科生,打着实践的幌子托人打招呼参加一两个课题,让以后的简历上好看一些。

不过这个学生才大一,就迫不及待的干这种事情,倒是有些奇怪。

虽说周传芳之前在院长办公室放话说这课题随便找个大一的学生都能做,那也只是气话而已,心里存了几分疑问,周传芳就沉着脸在办公室等着这个叫张小凡的学生上门。

也许是对方在办公楼下才打的电话,过了两三分钟就有人敲门。

来人彬彬有礼的在门口略微弯了下腰,“请问是周传芳教授吗?我是刚才打过电话的张小凡。”

周传芳虽然沉着脸,不过见对方态度还算恭敬,并不跟以前那些来镀金的学生那么张扬脱跳,心里对他的恶感倒是减轻了几分。

不过既然才大一,不好好学习基础知识,好高骛远的托关系走后门,跑来参加这种课题,在周传芳心里,也是胡闹行径。

不过这个叫张小凡的学生,还算懂礼貌,看样子也是个老实的学生,如果不是个草包,那让他参加这个课题也未尝不可,反正这个课题也不需要什么专业水平,技术问题手底下几个研究生完全可以应付,就是有些人手不足。

周传芳审视了张小凡一番,又随口问了一两个跟语音识别系统相关的信号与系统方向的基础问题。

问题不难,就是简单的信号的定义和分类这种最简单的问题,对计算机系的学生来说,这种问题只能算是常识,但是要知道,信号与系统是计算机本科大二才会开的课程,按理说大一的新生很少会接触到这方面的知识。

周传芳就是想看看这个叫张小凡的学生,对于这个电子审讯系统的课题有没有放在心上,有没有预先做过了解。

结果这个张小凡,既然真的回答上了。

虽然答案中规中矩,一点也没有脱离教科书上的范畴,几乎只是复述了一遍教材上的定义。

不过在周传芳眼中,这已经是难能可贵了。

起码眼前这个大一的新生,跟以前那些狗屁不通只为了贴金的学生比起来,要顺眼许多。

周传芳起了考较的心思,又多问了几个稍微有些难度的问题,结果就有些失望了,张小凡的回答都浮于表面,甚至有一个问题答得牛头不对马嘴。

不过周传芳很快意识到自己的问题,有些过了,对一个没《学过信号与系统》这门课程的大一新生来说,能做到这种程度的了解,已经是事前下了不小的功夫。

于是周传芳教授语重心长的嘱咐了几句,大意就是要踏踏实实学好基础知识,不要把心思花在歪门邪道上。

一番叮嘱之后,周传芳将手底下研究生的联系方式写给了张小凡,挥挥手让他自己去联系。</p>