第十六章 侃价狂魔(2)
作者:浙东匹夫      更新:2022-10-31 20:36      字数:3307
输入法?要有划时代的进步性的。”

  初音娘磁性的声音丝毫不带感情,轻描淡写地说:“当然有可能。”

  顾莫杰一骨碌从床上坐起来,语气带着激动和责问:“怎么个可能法?你怎么不早说?”

  初音娘略带无辜地反问:“你又没问过我,我怎么知道你有这个需求?人家只是一个计算机,不是人类。你问我答,天经地义,你还指望我出谋划策?”

  顾莫杰一想确实是这么回事,人工智能走到初音娘这一步,能够对人类的需求有问必答,不管答对答错,已经是很难能可贵了。对方并没有自我意识,也不可能主动为主人谋划。看来,还是自己对初音娘用得太少、问得太少了,没有充分进入一台智能机的主人这个角色。

  想明白了这一点,顾莫杰也不去纠结,单刀直入就问:“那你就说说,如果我们现在重新写一款软件,可以比目前放到网络上的那个‘万能输入法’增加哪些功能?”

  初音娘有条不紊地自检了一下,然后答道:

  “首先,目前放上去的那个输入法,终究是要依靠不停更新版本来升级词库的。比如我们从2月份的10版本,到如今的13、14,每搜集几个月的词频信息之后,就会升一次版本。这一点就很不智能,而且在网络新词增长速度越来越快的当下,新出现的词汇并没有办法马上进入到用户词库中去。

  如果现在重写一个版本,我们可以把‘在线实时更新词库’的功能加上去,让客户的词库在不知不觉中自动保持最新。

  其次,原来的输入法只有单向搜集用户输入习惯和用户主动构词信息的能力,并没有实时让用户共享这些输入习惯的设置。哪怕是对单个用户本身,我们也没有开放学习并记忆其输入习惯的功能。这一点,目前如果重写一个输入法的话,也可以解决掉。

  最后一点,则是我们原本缺乏对不同类型用户提供定制化细胞词库的服务,比如有两个用户,他们同样打hui-wu这样的拼音,第一个用户是个秘书,他可能希望打出‘会晤’这个词;而第二个用户是写散文的,或许他就希望打出‘悔悟’这个词。要知道即使是最大样本的词频统计,也只是对最接近大众的用户最优化,而非对每一个用户定制化地最优化。只有加入了细胞词库,让输入法在服务文秘用户的时候给一种词频,给普通用户的时候另一种词频,二笔用户的时候第三种词频,才能精确抓住所有人。”

  初音娘bb说了一大堆,顾莫杰越听越是惊喜。

  其实如果不是他对后世的记忆已经被洗得七七八八的话,说不定此刻他就会惊讶万分:这不就是2006~07年左右才上市的“搜狗拼音输入法”才做到的功能么?当然了,07年左右的搜狗,也只做到前两点改进而已,至于定制化设计和细胞词库这些功能,后世的搜狗其实都是到了08~09年光景才慢慢发展出来的。

  随后,顾莫杰又冒出了一个新的问题:“那为什么半年之前我们做不到这些功能点?当时是因为什么障碍,导致没法一步到位的?”

  “当时咱刚刚到这个时空,人家又没有2050年的云端数据库可以调用,当然没法一步到位。如今好歹通过软件商那个搜集用户习惯数据的后门,花了这半年,勉强搜集够了所需的大数据,有了素材基础,才能解锁这些新功能点的。”

  顾莫杰一听确实是这个道理,没有继续追问下去。

  不过初音娘却没有说完,顿了一顿,似乎觉得顾莫杰已经入彀,才狡黠地补充道:“还得提醒你一点,如果你真的准备按照刚才所说的三个技术要点升级�