手机号
验证码

正在加载验证码......

请先拖动验证码到相应位置

密码
确认密码
已有账号, 立即

已发送密码重置邮件到您的注册邮箱,请立即点击密码重置链接修改密码!

验证邮件24小时内有效,请尽快登录您的邮箱点击验证链接完成验证。若未收到邮件请先确认是否在垃圾邮件中。

查看邮箱

找回密码

手机号
验证码
新密码
确认新密码
没有账号? 立即 注册
Follow us on
@EVOLIFE 公众账号
On Wechat
@爱活新鲜播
On Weibo
@EVOLIFE.CN
On Instagram
Nina@evolife.cn
Mail us
@RSS
Follow our feed
微软六代小冰发布:云音乐保存歌曲已经out了 我保存歌手

微软小冰刚开始在国内测试的时候——当时似乎是2014年,还只有微博号,后来又加入微信,亲测下来觉得和真人用户互动的能力也有限,在很多人眼里,小冰的出现可能就只是一条不起眼的新闻,一直没有怎么关注它;微软自己也不把小冰的进化迭代当成是一件值得向普罗大众大张旗鼓宣传的事情,过去几年的发布会甚至都是在自己的据点——微软亚洲研究院开的。微软全球资深VP王永东先生甚至打趣说,在办公室开就是为了方便工程师和PM开完发布会马上就能回到工作岗位上继续干活。

P7610089

而这回微软小冰第六代特别发布选择在北京798艺术区一号车间进行,看来这一人工智能已经进化到了新的阶段,足够重要到能让微软跑出办公室进行发布活动。

核心技术升级

以人机对话为核心而起步的微软小冰,六代目升级仍然没有忘本,这次升级涉及到微软小冰情感计算框架的所有组成部分,在发布会上微软披露了数个核心架构上的更新。

P7610039

第一个是小冰的对话引擎升级。微软在第六代小冰身上采用了新的共感模型,可以视为去年的第五代小冰所采用的生成模型基础上的一种强化形式,五代目从语料检索到自创回应,已经是一个巨大的进步,但对于对话的控制能力还不够强。新的共感模型赋予了小冰对对话进行判断,使用策略决定是否要对对话进行引导的能力。

在以往的AI助手里我们面对得比较多的情况有任务式的对话系统,比如“帮我订个外卖”,“帮我叫个车”一类的语音指令,然后执行任务;以及知识性的对话系统,例如从百科获取信息解答问题。但在和人类的自然会话上,现在的AI助手多数还是一问一答,机械感很足,缺乏主动性的。

P7610058

而现在小冰可以通过一些无意义的闲聊,在和人类自然轻松的沟通中就能获得我们提供的关键信息或指派关键任务,对整个对话的上下文结合,控制对话走向的能力得到了增强。虽然在实际聊天过程中还是能发现她时不时会“不着调”,不过一旦讲到话头处,她总能有办法把对话拉回到正常的轨道上来。

P7610060

第二个升级是小冰获得了五感中的观感——由于在语音交互或是文字聊天当中,小冰虽然对一对一会话的掌控能力很充分,但在群聊过程中会处理不了第三者插入会话的情况,也当不了那个插入会话的第三者。于是微软在去年引入全双工语音的基础上,今年再为小冰添加了基于群的全双工语音,以及实时视觉的支持。

P7610062

微软在发布会演讲过程中播放的一段实验室视频展示了小冰能进行物体识别,也可以用语音指令指示和识别人类做动作,而且会区分自己和对方的左右;在发布会结束之后,笔者到现场的体验间里看了一下小冰新上线的“颜值鉴定”测试功能,借助计算机视觉,她会指示我移动到合适的位置,转动头部,做举手示意的手势等动作,还会用风趣诙谐的语言跟我打趣展示撩人的技能。不过最后我的这张老脸只拿到了65分,所以不管她怎么撩,我也不会搭理她的:P

P7610087

微软接下来要花一年时间把这个实时视觉功能包装成产品落地,而相关的线下设备测试现在就已经开始了。至于群聊全双工语音,后面会提到。

商业化生态合作

微软本次发布还公开了几个新的生态圈商业合作项目,分别来自网易、小米、腾讯和华为,他们通过构建Dual AI生态实现小冰和来自各方合作伙伴的AI项目在同一环境里共存,不论是在对应的手机机型或是app应用、IoT硬件中都能见到这种模式的影子。

先来看网易。之前网易和微软的合作,已经让小冰在网易云音乐和网易新闻客户端里有了相当的存在感,在前者里她是个电台DJ,在后者中她则在网易服务的本体(评论区)里能和网友们插科打诨,现在已经成为一个毫无违和感的有态度AI了,并且拥有数量众多的粉(xi)丝(fu)。

P7610069

小冰六代目的发布将会为网易云音乐带来两个新的AI角色,多多和西西,作为微软对AI性格塑造的实验性虚拟人格入驻应用,可以担当用户陪聊,寻找和发掘用户对音乐流派的喜好。多多和西西都以小冰的框架为基础派生出来,被赋予了不同的三观,在人机聊天的群体互动中更能通过不同立场的碰撞把话题给进行下去。(可以理解为,小冰是BB,多多和西西是Lip和Lilith?Alterego什么的真的很形象)

P7610068

然后是小米。小米的IoT智能硬件生态圈肯定不用介绍了,相信大家都很熟悉,而说到智能硬件你肯定会想到智能音箱,而智能音箱里面那个语音助手则就是各种各样的AI。小米生态圈的Yeelight语音助手盒子原本已经有一个小米的AI助手小爱同学,小冰加入之后,Yeelight就成为了全球首个支持全双工语音交互的同类产品。

20180323-01

如上文所述,有了全双工语音交互为基础,本次升级过的小冰的控制设备种类范围扩大,而且免去了每次语音交互都用唤醒词开头的麻烦,更强大的是小冰现在可以辨别是谁在说话,是不是在对它说话,并能有条理地处理各人和它对话的上下文,就像群聊一样。而在区分用户的基础上,它就能不混乱地执行各人发出的指令和请求,甚至还懂得家长控制权限区分。此外,音乐点播的功能加进来也不费事,所以微软也就顺手做了,不过也同时把小冰那种非皮这一下不可的个性也带了进来,不喜它这种嘴贫AI的人还是不要随便调戏以免生气。

腾讯和微软小冰的合作相对来说门类明显一点,就在QQ的聊天机器人上。好奇的人可能之前尝试过腾讯的Baby-Q,虽然这货在我的几个群里蹦跶几次最后得到的都是管理员禁言的下场,想来也肯定是深受小冰熏陶——事实上微软此前确实已经提供了一部分Baby-Q的功能,接下来升级过的小冰肯定要带着Baby-Q继续在跑偏的路上飞奔。而且随着形象的更换,对用户群体更加年轻的QQ而言,或许会博得新一批二次元用户的青睐。

P7610073

最后一个合作很多人都想不到竟然会是华为,从华为EMUI 8.2版本开始,微软小冰正式入驻华为品牌以及旗下荣耀品牌的所有机型,地位还非常高,占据了整个负一屏。微软在发布会上着重讲了小冰的语音备忘功能,而且强调在调取储存的备忘记录时,用户可以不用严格的调取指令,而是可以使用相对自然和模糊的人类语言来让小冰判断你想要从记忆里摘取什么信息。所谓好记的备忘录千篇一律,好查的备忘录万里挑一。

P7610077

不过华为手机上的小冰还没有开启多用户权限区分的功能,所以保管好备忘不泄露重要信息,还是你的事情。

赋予AI人类的创造力

商业应用离我们终端用户比较近,接下来说点远的。现在科技行业里对AI的期望目标似乎是“让AI更像人类一样思考”,虽然这种观点有着众多质疑,多数人觉得机器思维模拟不了人类思想,但微软至少正在用小冰做一些颠覆人们对内容创作认知的事情。

P7610080

微软布局AI创作领域是从2016年开始的,当时他们的想法是让小冰学唱歌,虚拟角色唱歌不新鲜,但让一个真的AI脱离人指挥去唱歌,好像没什么人做过。微软希望小冰能达到在全自动、无人工干预的条件下,快速生产出人们认为只有人类才能完成的歌曲演唱作品。

于是小冰开始了大量的材料学习,从录音中提取出人类的声线(嗓音,或者说声带振动频率模式)和唱法技巧,把他们导入机器学习模型里,让它能生成逼近人声的演唱。一开始的结果自然惨不忍睹,然而随着模型的改进,全双工神经网络的引入,仅仅一年的时间,小冰就已经达到能出单曲的水平,在AI中无出其右者,不过微软还想自我突破。

第六代小冰更新的第四版学习模型——微软称其为“沙鲁小冰模型”,在之前的基础上获得了演唱风格的学习能力,它可以把自己现有的嗓音,把原先与该并不匹配的唱法自然融合——想象一下以张韶涵的声线用腾格尔的唱法唱《隐形的翅膀》,不是开玩笑,这就是微软当场播放的小冰演唱片段。虽然听起来还是充满了小冰自己那种“谐”的味道,但从演唱角度来听,并不觉得生硬,如果你耳朵够尖,你甚至还可以察觉到它偷偷换气的声音。

P7610053

当然了,小冰并没有真的采集张韶涵的声线,现在的小冰语音采样来自浙江卫视的一位出镜主持人,但就以微软现在的技术,给你生成一个全新的虚拟歌姬,可能就是三天不到的事情,而且以假乱真到采样艺人所属机构的音乐总监都听不出来。微软甚至放话说,各种云音乐都是保存作品,而小冰直接保存歌手。

P7610046

就此,微软宣布成立小冰工作室,开始和合作伙伴一起,系统性地对人类创造力建模。除演唱之外,小冰已经掌握的诗歌技能,还有作词作曲、绘画等创作性行为都在这个工作室的研究范围之内。他们甚至还在琢磨为小冰大作独一无二的全新嗓音,不直接源自于任何一个现实人类,不过更多的披露要等到今年冬天。在那之前,大家就只能先看着第六代小冰更换的新虚拟形象自行发挥想象了……虽然我觉得这个油腻的画风真不太适合小冰,太像某个字母I打头会社作品里的小姑娘,还是像Kizuna Ai那样“智障”一点更有亲和力。

P7610085

老生常谈:AI又双叒来取代人类了?

猜都猜得到,仔细看完上面这些内容的十个人里有九个人脑海里会冒出小标题里这句话。不假,AI正在一点一点地把人类从那些机械重复,或者是偏简单但又容易出错的工作中解放出来。

而像小冰这样的则更可怕:例如在广播领域,微软已经让小冰在过去一年里主持了包括9大卫视在内,共计41家电视台和广播电台下属的21档电视节目、28档电台节目;在日本和中国累计生产了2878小时的电视广播内容。它没有错字不说错话不忘台词,也不会有绯闻和人设崩塌,提供持续和稳定的内容输出质量。它可能没有独到的主持风格和临场发挥,但一个不会发挥失常的角色却正是工业化流水线环境上最可靠的一环。

P7610042

其实要往好了想,如果人类都把自己当作社会机器上的螺丝帽,那小冰确实是来替代他们的,但这是一种解放——把人类从低创造性的社会活动中解放出来,投身到具有更高创造性的领域和岗位中去,这才是AI的初衷,其实也是一种爱偷懒的人类倒逼自己前进的手段吧。

不然,就真的只能被AI保存下来了。

P7610019

全文完
文章来自:爱活网
分享至: 0
了解更多

发表评论

评论
从现在知道的信息来看,应该还是ARM架构,除了ARM也没什么适合移动端的新架构。
还是arm架构吗,听说弄了新架构
EVO_1438 2023/05/25
能把我拍的好看点吗
EVO_1438 2023/05/25
今年realme的声音小了很多啊
EVO_1438 2023/05/25
版权 © 2017 爱活网 Evolife.cn 科技进化生活 [沪ICP备2021031998号]
版权 © 2017 爱活网 Evolife.cn 科技进化生活
[沪ICP备2021031998号]