当前位置:首页 > 语音识别 > 正文

语音识别流程图

ˇωˇIOS输入法怎么样?

iPhone上的中文输入法很多,但中用户最熟悉的应该有三家,搜狗输入法、百度输入法、讯飞输入法。 那么问题来了,这三家APPStroe上最受欢迎的中文输入法,哪家最好用最强大?

这一回,我们尝试从用户体验和好玩性的角度来PK一下搜狗百度讯飞三家输入法谁才是iOS上最好用的输入法。

这一回,小编就不做什么玄之又玄的测试,只做一些大家都能看懂并且都能自己跟着动手一起测测的简单测试。 让大家也能参与到测试中,才能真正体会小编为什么要这么测试,而这么测试的意义又何在,这功能上谁做得最完美。

测试中的配图如无具体说明,从左到右分别是搜狗输入法、百度输入法和讯飞输入法(排序的理由是,APPStroe的场占有率从高到低)。

图:iOS平台上的三大输入法——搜狗、百度和讯飞输入法

测试一:标点符号的输入体验

第一个要测试的是标点符号的输入体验,为什么先要测这个的理由是,在用户字速度都差不多的情况下,更快地帮助用户出标点符号的输入法,更能得到用户的青睐。

通过以下的三大输入法26键全键盘截图可以看到,三大输入法的布其实都是大同小异,按钮的间距和位置区别不大。 但有一点不一样的是,搜狗输入法是唯一一个将标点符号都显示在中文输入状态面板和英文输入状态面板下的iPhone输入法。 而在英文输入状态下,百度和讯飞输入法才显示标点符号。

图:三大输入法的中文输入状态面板

通过测试可以得出一个简单结论,在中文输入状态下输入标点符号,只有搜狗和百度支按住字母往上推就能输入对应字母上方的标点符号的体验。 但不一样的是,搜狗的标点符号都刻在英文字母上,只要不是瞎的,常用的标点符号都能轻易输入,而百度全靠自己猜(除非有十分刻意记住所有字幕上的标点符号,如百度上的“S”对应的标点符号是”@”)。

图:搜狗的标点符号是明着的,百度是隐的,讯飞只有逗号和句号是可以直接的

相比之下,讯飞输入法的标点符号输入体验就弱一点,支快速输入的只有逗号和句号,当然按住逗号也能快速输入其他常用的标点符号。

另外,在体验输入“@”的时候,搜狗在中文下按@就能直接联想QQ、163等邮箱,在英文输入法下可以一气呵成输入邮箱。 百度邮箱也能输入@直接联想QQ和163等邮箱后缀,但前提是先输入字母,然后按确定,再@才有后缀显示,跟搜狗的最大区别就在于没有一气呵成输入邮箱的爽快!相比之下,讯飞则没有@后联想邮箱的概念。

图:三大输入法的英文输入状态和输入邮箱的功能对比图

一句话小结,在标点符号输入体验上,搜狗输入法无疑是最好用的,简单直接,上滑直接出标点符号。 当然相比之下搜狗的中文输入界面看起来更密集一点点,但对于用户而言,在输入中文的时候更快更爽出标点符号的体验比所谓的简洁更重要啊!

测试二:移动标体验

滑行输入是什么功能?简单来说,当你出“爱你”的时候,想在“爱你”前面加入“我”字,在电脑上作只需按一下方向键上的“←”即可。 而在手机上作可没有这么简单了,iPhone原生输入法的做法是按住输入框的文字0.5秒后往左移动,是不是略麻烦的感觉。 那么三大输入法的滑行输入功能又如何?

搜狗的滑行输入体验是,在26字母区域内按住屏幕从右往左滑动,就可以快速将输入框的标位置快速往左边挪动。 而百度和讯飞的移动标方式一样,点击功能栏上的移动标杆即可实现标左右移动的目的。

图:搜狗百度讯飞的移动标功能体验

在实际体验对比上,搜狗和百度讯飞的移动标体验也有点不一样。 如下图所示,输入“爱你”之后,三大输入法都自动展示联想词,这意味着,百度和讯飞想在“爱你”字前面输入“我”字,则先按退格键关掉联想词才能使用使用移动标功能。 而搜狗没那么复杂,直接在键盘上滑动,即可将标移动在爱你的最最边,无联想词的存在。

图:移动标的拦路虎——联想词(搜狗不受影响)

一句话总结,毫无疑问,搜狗的移动标体验是小编感觉最赞的,无联想词的存在,想什么时候移动标就移动标。 但也有一个明显的缺点,如果用户不知道搜狗在键盘上任意位置左右滑动就是移动标这一个功能,那就比较蛋疼了。 当然,搜狗设了很多功能提示用户在键盘上滑动就能移动标,但估计还有用户不知道。 因此小编只能说,隐性的移动标功能用得爽,显性的移动标功能相对来说让用户更容易有这么一个功能。

测试三:语音转文字功能

语音识别功能对比上,小编只能说,语音识别准确率大家都是差不多,只是支的语种并不一样。

如果单论支的语种数量的话,讯飞这一回可谓是独风了,普通话、英语、中译英、英译中、中译韩、中译日、粤语、四川话、东北话、河南话、河北话、合肥话等23种语音和四种随身译。 搜狗则支普通话、粤语、英语、中译英等四种。 百度支普通话、粤语、日语、中译英、中译日、中译韩、英译中、日译中等多种。

图:一家比另一个支的输入结果

一句话总结,对于只用普通话的用户来说,三者的语音转文字录入功能区别并不大,识别率都很高,而在支多语种上,百度比搜狗多支了日语,讯飞比百度多支了多地方言语言但不支日语。

测试四:表情包功能

在斗图时代,输入法没有不自带表情包功能都不好意思说自己是输入法。

搜狗、百度合讯飞输入法都自带Emoji表情、颜文字等表情,都有类似于表情商店的功能。

图:三大输入法的表情包功能都不弱

图:让搜狗独风的Emoji造机功能+斗图DIY功能

如果要选出谁是最好用的斗图工具,那小编会把票投给搜狗,原因无他,搜狗的Emoji作机和斗图DIY功能实在是太强大!

测试五:键盘手写功能

三大输入法都支键盘手写功能,只是牺牲的代价不一样而已。 搜狗的代价是牺牲移动标和上滑输入标点符号数字的功能;百度和讯飞的代价是不能使用“点划输入”功能;好处是跟原来的拼音输入法一起用,不会的字无需切换键盘就可以写出来,简单快捷!

图:三大输入法开启键盘手写的提示与方法

至于手写识别能力,三家输入法的手写能力在小编看来是不相伯仲难分高下,毕小编也无法100%写出一样的字去一一对比。

图:三家输入法都能准确识别出“输”字

一句话总结,无论是哪家输入法,以后再也不用切换到专用手写功能上去字了。

测试六:智能纠错功能

智能纠错功能已经成为输入法的标配功能之一。 什么是智能纠错功能?还是“我爱你”三个字举例,拼音是woaini,i和o是临近的字母,手机屏幕大小,不少用户可能很就容易成了woaono,如果没有智能纠错功能,那就按照wo-ao-n-o来显示输出结果了,有了智能纠错功能就显示woaini的输出结果。

图:三家输入法对woaono的判断

一句话总结,三家输入法的智能纠错功能的测试结果基本上都一样,大家可以自己选一次常用词汇故意输错来测试一下。

测试七:通讯录输入功能

通讯录输入功能,对于部分用户来说不常用,但对于有需要经常出、地址等通讯录信息的用户而言,通讯录输入是一个不可缺少的功能。

通过下图可以简单对比得出,在地址上,只有搜狗正确识别出iPhone通讯录的地址填法,起码家份城街道的顺序没有错,而百度和讯飞的地址识别就顺序错乱。

图:搜狗、百度和讯飞输入法的通讯录输入功能

另外一点细节,如果通讯录中的名字有和地址两项甚至多项时,那么百度和讯飞都是默认勾选,用户只需点击“插入”即可将信息录入到字对话框中。 而搜狗则不一样,默认不为用户选择。

这不一样的细节会如何影响用户的体验?如果用户只想要地址不想输入的话的,百度和讯飞的用户需要先取消再选择地址才行;而搜狗只需点一下地址即可发出去。 反之,如果需要一次性发送多个的话,那么搜狗需要先点击“多选”,百度和讯飞则不需要。

还有一个细节需要说的是,如果只有或者地址一项,搜狗是不会弹出选择框,直接为用户输入或者地址,事力啊。 百度讯飞的界面依然一样,要求用户必须点击“插入”才能输入。

一句话总结,在通讯录输入功能上,小编的看法是,搜狗输入法的方式显得更性化更好用。

测试八:搜索功能对比

搜狗和百度都内置了搜索功能,这可能是搜狗和百度做搜索的天然优势吧!但体验上双方是完全不一样的。

搜狗输入法的搜索功能是在用户输入词语后点击“搜索”按钮就马上显示结果。 而百度输入法要先点击搜索按钮,然后在指定的输入框中输入想搜索的词语,最后点击“搜索”二字才会显示搜索结果。

图:搜狗和百度输入法的搜索功能使用流程图

简单举例,同样是搜索一首歌“告白气球”,在搜狗中只需2步即可得到结果,而百度中至少需要3步,而且还不一定你想要的结果。 因为百度只能显示网页、表情、翻译、等四种结果。 而搜狗则能显示翻译、、综合、生活、、音乐、地图、百科、新闻等9种分类搜索结果。 另外,如果用户输入的词是高频搜索的词汇,搜狗还会给出搜索的提示。

图:搜狗和百度的搜索结果对比

更令小编震惊的是,搜狗输入法然支直接听歌,不用切换到其他页面,就在当前输入法面板下就能直接听音乐!

图:搜狗输入法的搜索功能直接直接听歌

如果你将音乐分享给好友,无论你是直接分享还是听歌中分享,对方点开你的分享就能马上同样是听歌,不得不说这功能真的太赞了!

图:好友收到分享链接后一样能听歌

一句话总结,无论是搜索体验还是搜索结果,搜狗输入法都妥妥第一啊。

测试九:安装包大小

最后对比一下三家输入法的安装包大小,截稿前搜狗输入法4.6.1是75.6M,百度输入法7.5.1是92.4M;讯飞输入法7.0.1815是99.4M。 搜狗比百度等轻了至少15M,虽然不多,但令感觉更轻便些。

图:三家输入法大小对比

最后总结

iPhone中文输入法哪家强?相信大家看完文章和自己测试一番之后会有自己的体会。

如果只是用来字,那么感觉上哪家输入法的体验都差不了多少。 如果说谁的细节做得更完美,那么小编会选搜狗输入法,理由很简单,同样功能下搜狗在细节上更下功夫。 例如上滑输入标点符号和移动标功能是小编最爱的两个功能,字简单粗,不用来会切换!

如果喜欢用说话来输入中文的话,只要说的是普通话,那么三家输入法的体验都差不多。 而如果想将日语转成中文,那么百度输入法是目前唯一选择,如果想将粤语以外的方言转成文字,那么讯飞则是最好的选择。

如果喜欢自表情包,那搜狗输入法的斗图功能绝对是斗图虐必备神器!

好吧,希望本文能帮大家找到对自己最合适的iOS中文输入法。

╯^╰状态转移图有哪些

状态转移图有多种类型。


1.有限状态自动机(FiniteStateMachine):这是一种常见的状态转移图类型。 它描述了一个系统在不同状态间的转移过程,其中每个状态都是有限的。 这种图通常用于描述程序的控流、通信协议的工作过程等。 它由一组状态、事件以及状态之间的转移路径组成。 当某个事件发生时,系统会从当前状态转移到另一个状态。


2.马尔可夫模型(MarkovModel):马尔可夫模型是一种数学模型,用于描述系统状态转移的概率关系。 在这种模型中,系统的下一个状态只取决于当前状态以及所遇到的事件或条件。 这种模型常用于自然语言处理、语音识别等域。 状态转移图在马尔可夫模型中,清晰地展示了不同状态间的转移概率。


3.转移网络(TransitionNetwork):在语言学域中,转移网络也是常见的一种状态转移图类型。 主要用于描述句子的句法结构或词义消歧等问题中的上下文关系。 在这种网络中,节点代表状态或事件,边代表状态间的转移或事件发生的条件。


4.流程图(Flowchart):虽然流程图不特定于状态转移,但它也涉及到系统的状态变化。 流程图用于表示一系列步骤或作的顺序,可以展示决策点、循环和并行处理等情况。 在某些情况下,流程图也可以看作是一种简单的状态转移图。


以上所述的状态转移图各具特点,适用于不同的域和问题场景。 对于具体使用哪种类型的状态转移图,需要根据实际需求和应用背景来确定。

(-__-)b用户和天猫精灵通过语音交互的一个典型流程分析

虽然从普通用户眼中,使用语音向天猫精灵发起指令,然后收到后者的语音回复,这个流程似乎很简单,但背后实际上有着工智能中ASR(语音识别)、NLP(自然语言处理)、TTS(语音合成)等自然语言处理技术的参与和整合。

我们先来看一个典型的用户通过语音同天猫精灵交互的流程图。

用户用语音唤醒天猫精灵,后者接收到用户语音,上传到智能应用平台。

平台使用ASR(转文字)和NLP(自然语言处理)技术,智能解析出用户发出语音包含的意图(通俗的说,即用户当前期望天猫精灵完成什么样的作)。 平台会自动将当前用户指令,匹配到开发员创建的对应的技能和意图去。 具体的匹配过程,就是将平台所有解析到的参数信息,通过HTTPS请求访问开发者提供的服务接口。

开发者负责实现的服务(托管在自己的应用服务器或者阿里云Serverless环境),接收到平台发送的请求参数,执行业务逻辑(比如天气预报查询,智力题,语音游戏等),并组装回复结果。

智能应用平台收到开发者服务执行完业务逻辑返回的响应数据后,使用TTS(文字转)合成,并将推送回天猫精灵。

天猫精灵将收到的通过麦克风播报出来,本轮同用户的交互就完成了。

分析这个交互场景,不难,需要开发员动手作的流程包含以下两个方面:

在AliGenie技能应用平台上创建新的技能和意图,用于接收用户通过语音发送过来的请求。

应用开发员自己选择在应用服务器还是Serveless运行环境里实现新的技能需要完成的业务逻辑编写。

原文:https://juejin.cn/post/7103713067560599582