分享好友 最新动态首页 最新动态分类 切换频道
你每天在用但叫不上名字的黑科技了解一下
2024-12-26 11:12

大家这几年有没有发现,自己越来越离不开一样东西——语音。

比如小雷,自从微信整出个语音功能后,聊天由“文字交流”彻底蜕变成“语音大战”

不是你发语音我翻译,便是我发语音他播放。

玩个王者荣耀也从以前手动打字,成了今天输出千言万字全凭一张嘴。

方便操作同时还躲过许多“表面打字聊天,实为趁机杀你”的对线脏套路。

不仅微信王者,甚至蓝牙音箱也离不开语音控制。

小雷现在每天像个复读机似的对着小度音箱大喊“小度、小度”。

听听歌查天气预报啥的,偶尔调戏调戏小度。

还有现在火得爆表,几乎人人手机都有一个的“语音助手”。

苹果的智障助手“Siri”、百度的“小度”、小米的“小爱同学”、华为的“小艺”等等。

它们的使用与操控全靠语音完成,一句话帮你实现从地图导航到订外卖一条龙服务。

就连看个电视也逃不过语音代表“小度”的包围。

湖南卫视大热的综艺节目《向往的生活》,明星也爱带着小度吃喝玩乐。

炒菜靠小度提醒、出门靠小度导航,活脱脱成了个贴心小管家。

黄老师、何老师、彭彭哥哥、子枫小姐姐等瞬间成了它的小迷弟、小迷妹。

所以说,语音几乎成了我们身边无形的“第三只手”,如影随形,无法离开。

而这种通过语音控制手机、音箱等设备进行操作,将语音翻译成文字的黑科技,真正名字叫——语音识别技术

此时相信机友们肯定有个疑问:以前压根没见过“语音助手”、“语音识别

这种东西,为什么现在突然火爆起来,而且还那么好用?

其实鸭,语音技术并不是最近几年出现的,人家早在200多年前的清朝时期便开始蹦跶了。

比你大爷还大的语音识别

时间拨回1773年,那时有位俄罗斯科学家叫「克里斯蒂·克拉特兹斯坦」,他某天突发奇想,将共振管和风琴管连接起来,制造出一个可以发出人类声音的奇怪设备。

这便是人类对语音技术的第一次尝试,可惜后人对这个奇怪毫无X用的东西不感兴趣,一顿俄罗斯式破坏后扔到垃圾堆里。

到100多年后的1946年,第一台计算机诞生,让人们意识到,原来计算机很多事情做得比人还好。

(冯诺依曼与第一台计算机)

然而那时没有键盘没有操作系统,控制计算机全靠手动输入“0”、“1”信号,操作极度麻烦。

于是乎有人想道,如果能和计算机聊天交流,让它明白你在说什么,会不会变得更方便好用,做更多的事?(事实证明,懒是人类的第一生产力)

人工智能之父「图灵」便是第一个提出该想法的人。

1950年图灵发表了一篇名为《计算的机器和智能》的论文,里面写道:让人和机器交流,来验证机器是否有智能。

可惜他只贡献想法,却没有告诉人们怎么做。

没关系,图灵不干,自有人做。

两年后,著名的“贝尔实验室”研制出世界第一个可识别10个阿拉伯数字的系统“Audrey”,意味着机器成功听懂了人类的话。

大概属于能听明白“1、2、3、4”等数字,跟1岁婴儿差不多的水平。

这便是第一代的“语音识别系统”,被科学家称作“机器的听觉系统”。

(1954年的贝尔实验室)

又过8年,英国伦敦学院「Denes」开发出第一个计算机语音识别系统

专门用于电脑上进行语音识别,可惜仍处于只能识别几个英文字母和数字的级别,根本没法用到实际生活中。

话说起来,这台语音识别系统算得上是现在所有“语音助手”的祖宗,别看了,包括你手上那一台。

随后二十年,人类对“语音识别”的研究陷入原地踏步的死循环,没有一丝进步。

原因很简单:当时科学家把小孩学说话那一套用到电脑上,想像教育小孩一般让电脑学会“交流”。

你说人家电脑听得懂吗?你输入信号1和0倒能识别,你说个句子“who are you”,电脑计算得冒青烟也不可能理解啊!

直到1970年,语音识别迎来它的伯乐「弗莱德里克·贾里尼克」,人生实现一次转折。

弗莱德里克·贾里尼克领着IBM华生实验室,将统计学、信息论的方法加入到语音识别中,并提出“统计的语音框架”,让停滞多年的语音识别焕发第二春。

最终把语音识别从几百个单词量活生生提升到几万个,识别率由万年70%飙升至90%。

让语音识别有了从实验室研究到走向生活应用的可能。

(弗莱德里克·贾里尼克)

同样在1970年,美国DARPA(真正的黑科技机构,互联网就是它发明的)开始投钱研究语音识别,(苹果的Siri最初是DARPA投资研发的)。

目的是让战场的战士们用语音操纵武器,增强战斗力,也有说法是用来监控互联网和电话。

就这样在政府、大企业的投入与研发支持下,到了90年代语音识别技术已经能准确地理解人类的话语。

典型的产品就是IBM公司的“viavoice”,90年代末美国非常流行的语音识别软件

后来在20世纪初流入中国,然而没几个人用,因为那时电脑是比“钻石”还贵的奢侈品,哪个富家子弟会闲得肾疼,买来跟语音助手吹牛。

(中文版ViaVoice)

转眼来到2006年,这一年语音识别完成了200余年来最大一次蜕变,堪称“鱼跃龙门,原地飞升”

谷歌人工智能首席科学家「Geoffrey Hinton」提出“非监督贪心逐层训练算法”,让人工智能得到巨大突破。(可以理解为让电脑主动学习的算法)

一人得道,鸡犬升仙。语音识别在人工智能的加持下,获得质一般的飞跃。

(Geoffrey Hinton)

如果以前的语音识别是:

请问厕所怎么走?答:前面直走50米后再左转。

那么有了人工智能后的语音识别则是:

前面直走50米后左转,期间有1个红绿灯间隔15秒。厕所里有三个蹲位,其中2个已有人,剩余1个没有门,如果害羞可以绕道3公里外的卫生间如厕,记得带纸。

不仅技术得到突破,人们制作出超强的GPU硬件(英伟达公司),加上互联网提供的海量数据。

让人工智能、大数据、语音识别技术完美结合,美名其曰“AI语音识别”,预示着一场大变革的到来。

世界科技巨头第一时间意识到AI语音识别的重要性,美国的谷歌、微软,亚马逊等,中国的百度、阿里、科大讯飞之流纷纷投入AI语音识别的研发行列。

2010年苹果推出智障语音助手“Siri”,2014年亚马逊推出“Echo”。(国内没啥人知道,亚马逊音箱上的助手)

随后2016年国产公司小米、华为、百度等接连发布小爱、小艺、小度等语音助手,抢夺用户,占领市场。

于是乎语音助手们跟随手机、音箱等智能设备来到我们手里,由此开启一波“AI语音识别大潮流”

这便是近几年各种“语音助手”“智能音箱”突然爆发的真相。

据说,百度小度音箱的出货量已经超过了之前的国内老大阿里和老二小米

成了

全国第一!!世界第三!!

不过也是好事,大公司们竞争得越剧烈,我们这些吃瓜用户占的便宜越大。

而在这次世界级“AI语音研发大战”中,贡献最大的企业之一当数“百度”。

不仅早在2014年抢先亚马逊研发出Depp Speech语音识别系统,现在更是黑科技层出不穷,大大改善“AI语音识别”的体验。

百度语音不为人知的黑科技

小雷用今年新推出,新鲜火热辣的“百度输入法AI探索版”举个栗子。

黑科技一:中英文、方言混合语音输入

现在很多输入法支持中文语音输入,英文语音输入,唯独中英文混合输入却很少有,而百度输入法恰恰支持。

比如小雷在普通话里插入一个英文单词,百度输入法很轻易精准的识别到,并理顺句子转换成文字。

还支持方言转文字输入。(小雷此处用的是粤语)

在百度输入法语音里,小雷最喜欢的就是“语音斗图”。

随意喊出几个字,输入法立马找来几百个表情包任君挑选。

简直就是一个移动的表情包网,以后斗图还有谁?

不管你说四川话、粤语、东北话、英语还是混合着说,百度输入法统统能识别,让用户真正实现“自由说、随便说”。

事实上这就是百度语音合成技术能力的体现遥遥领先于同类工具。

黑科技二:全双工免唤醒

用过智能音箱的机友都知道,每次唤醒音箱时都得喊“小度小度”之类的贼麻烦。

有了全双工免唤醒后,我们只需唤醒一次“小度”,之后便可以和小度持续深入的交流。

而且在深入交流中,小度会很机智的识别出哪些话是对它说,哪些话是对其他人说的。

即使是在多人对话的嘈杂环境里,小度仍然能分清哪一句是对自己下达的指令,像是拥有思想、懂得主人需求的“贴心管家”

知道你们一脸懵逼听不明白,看看百度老总李彦宏的现场演示就懂了~

百度展示的”全双工免唤醒“黑科技打破过去啰嗦低效的唤醒方式,再一次刷新AI语音交互的上限。

让我们享受到真正高效的“动口不动手,想做什么直接说”的便利。

黑科技三:百度鸿鹄芯片

百度不仅在软件上努力,为了让AI语音助手更好“听见你,听懂你”,还专门打造出针对语音交互的芯片——百度鸿鹄芯片

芯片指令集全由自家定义,是实打实的国产芯片,拥有高精度、低功耗的特点。

有了针对性“芯片”加成,语音助手再次被强化,支持离线语音识别同时带来更丝滑流畅的使用体验。

专门为语音助手打造一个芯片,百度在语音识别方面是真的“硬核

黑科技四:流式截断的多层注意力模型

流式截断多层注意力模型,相信很多机友看到后第一反应是:啥玩意?能干嘛?

小雷用人话解释下:目前大部分语音识别使用的技术叫“Attention模型”,特点是将我们输入的语音全部上传到服务器后,进行翻译再传送回来形成文字。

这就导致了两个问题:因为需要上传整段话到服务器,所以语音识别的效率很低,加上对整段话进行翻译,难免会出现翻译错误的问题。

所以百度针对上面两个问题,进行了深入的研究,最终研发出“流式截断的多层注意力模型”。

“Attention模型”的基础上,将整句语音进行截断,由以前的一大段分割成一小段一小段地上传到服务器中进行翻译。

这样一来不仅解决了翻译转化文字慢的问题,还大大提高了识别精度15%。

别小看小小的15%,这可是一项对全球学术界和工业界都具备重大意义的技术突破,如同当年弗莱德里克将统计学加入到语音识别中,改变语音识别的一生。

AI技术改变的不止是生活,还有世界

随着百度等大公司大力研发AI技术,未来可不止让我们生活变得便利那么简单。

甚至是改变整个世界!不信?最近让无数女性化身“上头迷妹”的《亲爱的,热爱的》电视剧就剧透了未来AI技术有多牛。

在《亲爱的,热爱的》第18集中,佟年给韩商言讲解了人工智能在刑侦方面的应用:

她设计出一个人脸识别系统,专门用于帮助警方搜索犯人调查犯罪,破案1000多起。

其中有一个案子特别夸张,佟年向系统输入一张十年前的杀人犯照片,通过大数据匹配筛选,最终帮警方从14亿人里成功找到已经剃发当和尚的杀人犯。

其实利用AI技术抓逃犯的事情是真实存在的,并非电视剧瞎编。

在2018年7月,衢州警方利用AI技术识别到嫌疑人的照片,并通过大数据追踪其位置,破获长达6年的“电鱼迷案”。

AI不单可用于惩治犯罪,还能寻找失踪人口。

2019年6月19日,深圳警方通过AI技术寻找到徐远灵被拐卖19年的亲儿子。

失散19年的一家人,最终在深圳公安局帮助下团聚,圆了徐远灵多年以来的梦。

小到智能音箱查天气,大到查案追踪逃犯,背后全是AI技术的默默贡献,蕴藏着深厚的技术能量。

最新文章
问道加盟
  【市场优势】  1、媒体,网络等多方面的品牌宣传;  2、全国各地设置分支机构及战略合作伙伴,统一的品牌及企业文化导入;  3、全国各地定期举办线下交流会;  4、成为福建游龙网络科技有限公司的战略合作伙伴,共享旗下产品资
这款AI论文写作在线工具助你一臂之力!论文生成不再难
​​创新性强:开启学术研究的新思路时间对于研究者来说无比珍贵,千笔AI论文深知这一点。它通过高效的选题建议生成机制,大大缩短了研究者在选题阶段的时间投入。只需输入关键词、研究领域或基本要求,千笔AI论文就能在短时间内提供多个精
雨人Ghost Win7x86 SP1无精简纯净版
雨人Ghost Win7x86 SP1无精简纯净版_C8.32***************************GHOST版的迅捷 安装版的品质 百分百完整 真正的纯净雨人Ghost Win7x86 SP1无精简纯净版_C8.32 ------智能识别品牌机兼容机,自动激活……****************************
鹤岗网站排名优化,策略与实践,鹤岗seo
鹤岗网站排名优化策略与实践,包括关键词研究、内容优化、链接建设等。通过深入了解用户需求和搜索习惯,选取合适的关键词,提高网站在搜索引擎中的排名。注重网站内容的质量和原创性,定期更新有价值的内容,吸引用户访问和分享。积极寻求
超逼真美女写真生成全攻略,教你用AI轻松制作完美作品!
在社交媒体蓬勃发展的时代,我们似乎每天都被美丽的图片和视频包围。然而,这些令人心动的写真到底是如何生成的呢?是否有一种工具可以帮助我们轻松制作出逼真而富有魅力的美女写真?答案是肯定的!通过画画、拍照、修图,我们可以用AI技术
高档轿车的智能化配置有哪些亮点?
高档轿车的智能化配置亮点众多。比如奔驰纯电 G 级,内饰搭载第 2 代 MBUX 智能人机交互系统,有“数字越野座舱”“实时越野路面影像”功能,可选 MBUX 高端后排娱乐系统,丰富车内娱乐。奥迪 AUDI E 概念车,采用激光雷达路线,配备高级驾
连点器免费永久版下载安装
连点器免费永久版下载安装是一款无需root权限的连接器app,它可以帮助用户快速连接,解放双手,非常完整和强大。用户只需要设置点击频率和点击位置,就可以挂机了,而且还支持后台自动运行。这款万能连接器非常实用,适用于各种需要频繁点
香港最准100‰免费,揭秘“香港最准100%免费”关键词背后的真相与风险:警惕网络陷阱,保护个人隐私安全
  揭秘“香港最准100%免费”关键词背后的真实面纱与潜在危害  摘要:
雷雨 pdf epub mobi txt 电子书 下载 2024
他被称为“东方的莎士比亚”,他的四大剧作在舞台和人间反复上演。 每部剧作都是他对那个时代热烈的的爱与恨,都是一首燃烧生命的诗。 生命始于夏,作者出于一种“情感的迫切的需要”,“以一种悲悯的情怀来俯视这群地上的人们”,通过两个
成色好的Y31S是国产精品首选-体验卓越性能与高性价比:打造智能手机新标杆!
在如今的智能手机市场,国产品牌的崛起带来了更多的选择,而成色好的Y31S作为一款经典之作,以其卓越的性能和高性价比赢得了众多用户的青睐。这款手机不仅在外观设计上精致独特,在硬件配置和用户体验上也做到了极致的平衡,成为不少人心目
相关文章
推荐文章
发表评论
0评