1 新智元原创
演讲:朱频频,小i机器人总裁兼CTO
英文部分来源:VentureBeat
编译及整理:刘小芹、闻菲
【新智元导读】近来掀起的这股Bots热潮中,国外产品的名字反复出现,然而,日前发布的 Gartner《2017十大技术趋势发布》中,谈到对话式系统时,将中国的“小i机器人”与亚马逊 Echo、微软 Cortana、苹果 Siri 等全球几大对话系统并列。在刚刚举行的世界机器人大会闭幕式上,由小i机器人参与建设的智能机器人Bots开发平台正式对外发布。大会同期举行的“Bots·唤醒未来”分论坛上,小i机器人总裁兼 CTO 朱频频发表演讲《小i机器人助力,让 Bots 无处不在》,披露了小i机器人的技术,公司发展历程,市场拓展经验等优势以及取得成功的原因。【回复1025下载全部54页PPT】
点击阅读原文,可在爱奇艺观看2016世界人工智能大会全程回顾。以下是开场视频。
(文/ Dave Cotter,编译/刘小芹)过去一年里,我们目睹了Bots、人工智能(AI)和机器学习的快速发展。许多创业公司正在利用 AI 和 Bots帮助消费者通过移动设备以有趣而富于创造性的方式与品牌互动。
Bots发展八大预测:Facebook 将努力模仿微信
随着业界对 Bots 的兴趣日益增加,对创造性的 Bots和 AI 解决方案的投资也越来越很多。针对未来 18 到 24 个月里 Bots将有哪些变化,我们提出了以下八大预测:
1. 出现更多解决现实世界问题的Bots
早期的 Bots 似乎多数更像是寻找问题的技术,而不是以客户为中心的解决方案。随着对 Bots 的炒作减少和技术的成熟,以及从客户那里得到的反馈,Bots 处理的问题将变得更有针对性,相对也更有价值。
2. 更好更多的交互设计
乍看起来,像 Bots这样的消息系统似乎不需要交互设计,它只是用户和智能代理之间的双向对话——就像两个人之间的短信交流。这是错误的想法。Bots 的语境交互设计与网站或应用程序的交互设计一样重要,甚至更重要。会话界面的灵活性和流畅性需要灵活的设计范例和工作流程,需要为用户建立直观的体验性和合适的功能可见性。我们认为,对话界面的交互设计将成为独立的设计学科。
3. Bots 将更加智能,但不会取代人类智能
人类语言是非常微妙而复杂的。假如一家公司试图尽量利用 AI 和Bots解决问题,成功的关键是需要幕后有人参与。让用户与 Bots的交流陷入无限循环是非常可怕而糟糕的用户体验,假装“幕后没人”是愚蠢的。至少在可预见的未来,真实对话能力还是人类胜过机器,所以一个包含真实的人类语言输入和算法的混合方法能产生最好的体验。
4. 垂直解决方案是创业公司为客户创造价值的最佳机会
说实话,构建能接近实时理解人类语言并和人交互的智能应用程序真的很难。这个问题对Alexa、Cortana、Google Now 和 Siri 这样的应用程序来说更难,因为它们的扁平性使用户可以向它们询问任何东西。创业公司可以利用现成的自然语言处理(NLP)和定制的机器学习技术,通过限制会话范围,创造高质量、不断演进的 Bots,为客户提供愉快、自动化的交流体验。
5. Bots不会取代 APP
一些专家认为像 Bots这样的智能代理的兴起将使应用程序,尤其是移动设备上的 APP 消失。这是无稽之谈。某些情况下,本地应用程序可以提供丰富的、交互式、沉浸式体验,因此更重要。另一些情况下,Bots 轻量、双向的交互方式能让用户体验更简单、快速、愉快。两者将同时存在,分别适用于不同的场合。
6. 千禧一代将引领基于对话的商业转变
对于千禧一代及他们之后的世代,发信息(Messaging)将成为人与世界互动的主要方式。这一代人发现新产品和内容的方式是与朋友以及与社交网络的熟人进行对话。我们认为,通过将新的服务与支付交易无缝对接,较早开始采用这些技术的企业将获得 8000 万用户,而这些用户年购买力将达到 2000 亿美元,使“对话商务”成为现实,而不只是一个流行词。
7. 短信将继续是主要的消息方式,Bots 在其中扮演重要角色
虽然 Facebook Messenger,Snapchat 还有微信(WeChat) 已经积累了大量的用户,但简单的文本消息形式将会继续存在,并且是 chatboot 的重要渠道。当然,文本消息也存在挑战,但它是一个没有任何社会平台可以取代的开放平台。此外,任何地方的任何手机(智能或不智能)都可以使用短信,几乎覆盖所有人口。只要人们有手机并需要非语音通信,就可以用到短信。这为 Bots 创造了一个成熟、开放的平台。
8. Facebook 和 Snapchat 将努力模仿微信
美国的社交信息平台仍然处于初级阶段,为企业和消费者提供参与平台并转化为交易的能力不足。微信现在占据了中国电子商务市场的三分之一。在接下来的 18 至 24 个月,我们期望 Facebook,Snapchat 以及其他公司将更多投资放到改善 Bots 功能、提升用户体验上,这将有助于实现数字商务消息界面的重要转变。
小i机器人,中国 Bots 的骄傲
在近来掀起的这股Bots 热潮中,亚马逊 Echo/Alexa、微软 Cortana、苹果 Siri 等国外产品的名字反复出现, 然而,在刚刚发布的 Gartner《2017十大技术趋势发布》中谈到对话式系统时,将中国的小i机器人与 Apple Siri、Microsoft Cortana、Amazon Echo 等全球几大对话系统。
小i机器人是什么公司,他们的产品有多厉害?
小i机器人今年与世界领先的语音公司 Nuance 达成了全球战略合作伙伴关系。除了 Bots 及其涉及的语音、自然语言处理和深度学习技术,小i机器人还提供多种基于人工智能的解决方案,甚至在量子计算方面都有技术研发和产业布局。
在刚刚举行的世界机器人大会闭幕式上,由小i机器人参与建设的智能机器人 Bots 开发平台正式对外发布。大会同期举行的“Bots·唤醒未来”分论坛上,小i机器人总裁兼 CTO 朱频频发表演讲《小i机器人助力,让 Bots 无处不在》。以下为演讲实录。
让 Bots 无处不在
朱频频:大家好!我今天演讲的题目呢稍微变了一下,论坛主题是 Bots 唤醒未来,我总结了下,我们之前在做什么事情呢,就是让这个Bots无处不在,让 Bots 可以承载更多的商业应用。我们整个大会的背景是世界机器人大会,当我们一谈到机器人的时候,可能我们脑海当中就浮现像变形金刚这种科幻电影里面的形象,还有动画片里面的大白。
一般认为,一款完整的智能机器人有三个非常重要的要素,分别是感觉、运动、思考。这跟人也比较对应,感觉是像人一样可以去看、可以听到外界的信息,运动就是可以走动、做各种各样的动作,当然,做为一款智能机器人,最重要的就是大脑部分,也就是具有思考能力。如果一款智能机器人没有运动部分,甚至没有外观,那它就是虚拟机器人,也是一款 Bot。感知方面,无论语音还是图像,由于深度学习技术的发展,人工智能技术已经在某些方面达到甚至超越人类的水平。思考层面则主要由认知智能驱动,核心问题就是语言、知识甚至还有常识等很多内容,小i核心的研究,包括产业化的目标,主要集中在语义、知识以及尝试建设整个系统和应用的过程当中,我们的工作就集中在认知智能方面,尤其是自然语言和知识层面的工作。
那到底什么是 Bots 呢?我做了一些比较抽象化的描述,Bot 是虚拟机器人——这个不是定义而是一个描述。Bots 是基于认知智能的,是对语言的理解,是一个技术的软件。另外,Bots 是在通讯平台上数字用户,这个怎么理解,比如大家都在用微信,微信是两个人对话,我们在用一个会话界面在进行,如果对方不是一个人,是一个数字的用户,那对方就是一个 Bot。我们在 2014 年发布小i机器人的时候,就可以添加小i机器人作为好友,然后聊天。
按照 Bots 承载的内容和功能目标来分,有几种不同类型的 Bot。Chatbot 这个词比较通用,一般叫做聊天机器人,小i就是一款聊天机器人。2004 年 1 月份的时候,大概超过 2000 万用户使用小i机器人。当时,甚至有一个人成天成夜跟小i聊天,倾诉他自己的感情。Chatbot 还有一个叫法是陪聊机器人,我们参加一些活动的时候,别人介绍“这个公司是陪聊出身的”。
当 Bots 的对话内容不是通用内容,而是某一个行业的内容,它就成了行业的专家,比如说客服工作——智能客服机器人,在国外叫 VCA(虚拟客服助理),一个典型应用就是招商银行小招,在各种的移动终端,包括传统的服务渠道,通过电话、微信等多种方式提供智能服务。
另外就是虚拟个人助手(VPA)。VPA 其实有很多了,微软 Cortana 还有今年 7 月份才发布 Viv 这款软件,他们说年底正式发布,但是很不巧,还没有等到发布的时候就已经被三星收购了。这家公司跟 Siri 有很大的关系,Siri 被苹果收购以后,三个创始人其中两个离开了苹果,后来创立了 Viv。一直很期待他们之前说的年底的发布会,现在还没有看到它的产品,还是比较遗憾。
还有一类 Bots 是硬件整合的,主要是通过语音会话方式进行交互,所以核心还是会话交互。
Bots 有哪些优势?在去年的 Gartner 的分析报告当中,Smart agents(智能代理)——是 Bot 的另外一种称法——移动端的交互量将增长40%。相比 APP 来说,Bots 到底有什么样的好处,导致大家认为会出现一个叫做后 APP 时代?我总结了一下,不一定非常全,第一个方面,Bots 相对于APP来说呢,更加便于使用,因为APP首先需要下载,下载完了以后,下载完了以后要去看什么介绍使用,要翻很多屏才可以使用,我觉得这是很烂的。而且每一个APP使用体验也是不一样的,需要你去适应,但是 Bots 是完全一样的。
第二个,对于开发者和运营者来说,Bots 更易使用和开发。应用逻辑在里面,不用花大量的精力,研究如何建立APP的 UI 等。还有非常重要的一点,Bots 是跨平台的,无论是微信,还是 Facebook 这些都可以用,但开发一款 APP 你要适应不同的版本。
第三个好处就是易于传播,很多时候你只需要添加一个好友,甚至你只需要扫一个二维码,不用做很多的工作。还有一个非常有意思的事情,因为 Bots 交互接口是统一的,当一款 Bot 不懂这个问题时,它可以去询问另一款,大家甚至会认为,自然语言是未来软件和软件之间交互通用接口,而不用使用程序的接口。在国际上,巨头们之前推出很多 Bots,现在也开放给开发者,有的变成开发平台。
现在可以用 Siri 打开滴滴直接叫车了,谷歌发布最新的一款软件 ALLO,这款聊天工具最大的特色是两个人在对话,我们来看这个示例:其中一个人发了一张很漂亮的日落图片,在我的交互界面中就会出现三个部分,第一个写很漂亮的日落,所以它其实已经具备读图的功能,对图片里的场景识别有一些功能;第二个是很漂亮。这些快捷的回复,可以随便点一个快捷回复给你的好友。这个像在敷衍你的好友,假设你哪天跟你的朋友很好心分享一张图片,结果他在应付你,甚至都没有仔细看是什么样的东西。这个地方完全是虚拟机器人去做,就是一款 Bot,里面就是用户跟 Bot 交互的界面。
微软在 Bots 上面投入了很大的精力,“对话即平台”这个词是微软首先提出来的,就是会话式的交互界面。我们平时用通讯工具的时间也是非常多的,已经占据了我们大部分生活,其实通讯呢天生就是一个会话界面,比如说微信,文字、语音、图片,都可以用来进行交互。微信的月活跃用户据说已经达到 8 亿,移动 QQ 月活跃用户比微信还要高。但世界上最大的即时通信工具是 Facebook 的 WhatsApp,现在是 11~12 亿,Facebook 活跃用户已经过了 10 亿。还有源自俄罗斯 Telegram,在韩国日本非常流行的 LINE,已经覆盖全球,甚至在非洲都占据了非常大的市场份额。
所以我们会看到,Bots 引入的载体实际上是非常多的,Bots 会有非常大的发展前景。所以,Bots 好时代已经开始了,我们小i机器人现在处于非常好的位置,全球领先的位置。这个不是我们在自吹自擂,我们看一看,这是就前几天 Gartner 全球峰会上的分享的PPT,里面提到,会话式交互界面系统是未来的主宰,就是 Bots 应用,现在谁是领先者,小i、Siri、Cortana 这些是非常典型的。这是雅虎当天的报道,小i是其中非常重要的一员。我们再来看右边这个词,很有意思,我们天天在说互联网+、人工智能+,老外也在学我们,这个叫 “Conversational+”,就是未来一切东西都可以把会话加入进去,所以大家会看到,未来会是一个非常好的发展前景。
从虚拟到实体,小i机器人 落地应用实例
我下面就说说小i的故事吧,我们一开始做的是虚拟机器人。我们最早在MSN推出聊天机器人,2004 年 1 月份正式上线,可以跟它对话,查询很多功能,甚至后来MSN 支持也把语音功能整合到里面去,用户增长速度非常快,大概超过 5000 万的用户,我们当时提供了很多的功能,大家看看跟现在的聊天机器人功能是非常类似的。这些事情我们 2004 年就做了,但是这些用户让我们赚不到钱,不能成为一种商业模式,我们当时拿了不少的钱,都烧光了,烧出了一些技术,烧出了我们团队,但是没有赚到钱,我们走了另外一条路,把我们的技术和经验用在了 2B 领域,就是为政府和企业提供 2B 智能解决方案,这是我们公司走上另外一条很好的道路。
从 2011 年开始,我们做了非常多的智能客服方面落地的应用,取得了非常不错的成绩,在网页上面做了智能客服的案例,还有中国移动的、招商银行的、联想的、京东的、上海税务局的,微信上的智能客服机器人等等。中国联通的客服机器人叫做沃妹,招商银行的客服机器人叫小招,顺风速运的机器人叫做丰小满。短信上的客服机器人,建设银行、中国移动。在WAP,在QQ上,在飞信上,另外在手机APP上,在手机APP上除了用文字交互的方式,还可以用语音交互的方式。
我在很多场合都谈到,它们虽然不叫小i,但都是小i作为技术支撑的。还有短信交互形式,之前我们要发短信查询余额可能要记住指令,现在自然语言就可以直接去说了,大家都可以尝试这样的服务。另外在手机 QQ 上的客服机器人,也可以用语音来进行交互。
除了虚拟机器人之外,我们现在也推出实体机器人。我们形象地说机器人的大脑思考能力在云端,把线上的云端能力给迁移到线下来,跟实体进行整合。当然这些实体其实都是我们第三方合作伙伴的,右边颜值还不错的机器人是韩国合作伙伴的,中间是大家比较熟悉是法国的 Nao,左边的机器人是上海的机器人合作伙伴,叫木爷机器人。根据客户的需要,可以应用在不同的场合。
银行使用智能客服的回报非常明显,也不仅这两家银行了,全国前 50 家我们占了 38 家。为什么有这么多的企业在采用智能客服?以中国建设银行为例,在微信上的智能客服机器人每天有 6000 万次会话,一年节省 6000 个人工坐席,一个电话坐席一年差不多十几万人民币,节省的费用是非常可观的。交通银行也节省了很多的钱。
不仅仅是银行业,运营商、政府也在大规模地采用我们的解决方案,还有更多的行业在使用小i机器人的产品和服务。我不敢说人工智能领域,我只能说智能机器人这个产业应用里面,小i是最大的,因为我们做的客户是全球最多的,我们在去年年底的时候也登陆了新三板,应该说是智能机器人的第一股,像阿里巴巴等一些大公司也是我们的股东。
智能客服机器人小i是第一,为什么会取得这样的成绩,完全说是技术也不完全是,这个跟产业发展也有很大的关系。
外部的评价:Gartner 对小i机器人的评价不错,认为小i机器人不仅是智能客服的提供商,而且是智能机器人平台的提供者。就在刚刚的10月18日,美国奥兰多Gartner全球峰会发布了《2017十大技术趋势发布》,在谈到“对话式系统:后APP时代的网格化体验”时表示:小i机器人、Apple Siri、Microsoft Cortana、Amazon Echo等全球几大对话系统,通过聊天机器人(ChatBots)或者个人助理(Personal Assistants)将云端的智能交互能力展现出来,而这种云端的智能交互能力可以以虚拟的方式呈现,也可以对接至一切的硬件终端,他用了“Conversational+”,这个概念其实就是我前面提到的Bots无处不在。
另外,我们来看 IVR 这个技术,在美国首先采用,但是引入中国的时间是非常迟。像 IVR提供的电话语音导航的功能,在国内还没有大范围的采用。但是呢在互联网上这种虚拟客服助手(VCA)被我们中国率先使用起来,在美国直到最近才大规模被采用。
智能服务机器人核心技术揭秘
下面说一下技术,关键技术我们理解一下这个基本的架构,当然说 Bots平台,最直接的,对于开发者来说,要适应不同的开发框架和这些平台包括的一些工具。
Bots 其实不完全是用文本进行交互的,Bots 是多模态的交互方式,包括文本、包括语音甚至是图像,多模态交互方式。感知智能技术这个是前端,另外呢对自然语言的理解,包括对知识的推理工作呢,都是在认知智能知识以及在知识驱动之下的智能问答系统。
下面是基于大数据和学习的知识学习体系,这个可能是我们人类可以读懂的,也可能是我们人类读不懂的形式。
目前我们小i提供的东西呢,在全渠道的交互方面,全渠道已经在我们产品当中已经都支持了,另外多模态交互方面,文字、语音、图像还有体感都已经整合到我们产品线当中。目前最核心的智能对话引擎,包含自然语言分析、语义理解、知识推理、个性化,回答生成、上下文,另外还把基于深度学习的情感分析模型,融入到智能对话过程中,就是很好的用户体验。
最重要的就是我们多维知识库的模型,以及基于学习的人机协作学习体系,这个非常重要。模型包括从概念到本体到专家系统,有一些专家系统就是学习出来,人可能看不懂,但是机器是可以读懂的。下面我就快速过一下,目前已经覆盖了 10 多个行业,100 多个领域支持。
大家可以看到,其实这是一个设计器,通过这些数据背景,在这些基础知识上面,我们可以设计交互的场景,是可以自动完成的,只要我们设计好,所谓的设计就是告诉它你要做什么,然后这些过程就可以自动生成。比如说这里面就是非常典型的语音交互,问这样一个问题,上海明天下午 5 点比北京高多少度,你要把两个做一个比较,我们看到这个结果,上海比北京高 12 度,这里面提到广州后天多少度,这个比较容易可以查到,他直接去说,比哈尔滨低几度,我们可以看到实际上广州的温度是比哈尔滨高的。这里面还有一个关联问题。我们也可以把一些有趣的事情给它植入进去,问是低是高,我用一些比较俏皮的话可以回答,所以任何的应用场景里面,这些都可以根据商业需要完全做定制化的工作。
平台化发展,对接更多应用
小i的 Bots 平台发展的历史,我们小i的 Bots 平台,我们分成三大类Bots平台,第一类就是为这些大型的企业提供了 Enterprise平台,第二类是叫做 Cloud,为中小企业开发者提供的平台,他们可以快速的做这个Bots,最后一个是操作系统,这是针对智能硬件,Bots提供的基础。
在这个历史上面,我提一句,十几年前我们就提出了Bot,十年前,我们当时跟微软是战略合作伙伴关系,提出了平台概念,我们在 2006 年就把它叫做 iBot Platform,所以这个词并不是今天才开始叫的,我们很早之前就把它叫做 Bots了,这一部分 iBot Platform 的商标,还有很多的东西我们都注册了。2011 年我们正式推出了首个企业级的平台产品,叫 iBot 6 Enterprise,2013 年我们推出了 iBot Cloud ,2015 年我们推出了iBot 8,另外一款比较全新的企业的产品 iBot OS,到了 2016 年我们标准版产品 iBot 10 Standard 也正式发布。
对于 Bots 企业级平台来说,架构是完全基于知识的,这个知识通过知识管理和知识学习方式来进行不断的完善、优化,这些核心引擎,像语言理解,智能语音,智能搜索,在这些能力之上,还有一系列的智能服务。还有跟企业级产品配套的,分析的这些产品,它能够协助我们快速根据用户之间的提问,可以快速的反馈知识不断地学习。
我们也发现,其实机器人不仅仅可以在前面做客服服务的工作,它还可以帮助我们提高效率。刚才也提到了,机器人和人工是在联合协作的,人机协作,人机协作过程当中可以相互学习。
我们现在不仅仅支持中文,我们也提供繁体中文和英文版本,台湾的合作伙伴也在台湾帮助我们建立整个产业。
这个是面向中小客户和开发者的 Bots Cloud,标准级平台和开放平台。
关于这个公众云,我们在大会现场有4节课培训大家,如何成为我们Bots的一个开发者。这个是一个离线版本,整合了语音的能力,是一键化安装。
我们有语义云平台,开放给开发者。这个语义云平台大部分是从数据里面进行学习,形成了语义云核心的东西,里面提供了包括文本纠错,自动摘要,文本聚类等等的,比如说分词进行标注,更重要的提供领域行业的基础的能力。
最后一个就是说面向智能硬件和智能机器人的iBot OS,这个操作系统呢其实它就是为了适应多种实体的这样一些基础的操作系统,我们在端那边做了这样一层,包括它核心能力是云端。具体来说呢在一些平台上,我们提供的一些框架的SDK。
我们还提供了一些低端硬件设备能力,比如说对于一款玩具,我们想植入这个智能交互能力,因为没有设备,我们很难植入进去,怎么办,我们可以把一个小模块嵌入进去,目前这个iBot OS已经可以支持多种基础的操作系统,包括IOS包括安卓。
接入的每一款硬件,在后台它的沟通交互能力都是可以去被定义的。我们可以在后台管理它。我们可以看到它的交互流量,我们通过其他的功能管理这个机器人,面向硬件的机器人。基于这个iBot OS我们也推出多种解决方案,跟很多智能硬件都可以对接。我们现在已经在跟一些硬件做比较深度的整合,包括资本层面的整合,可以更好的结合在一起。
植入到我们云端智能交互能力的也很多,我们展台上面也有,5月份的时候跟我们李克强总理也进行了交互。
下面一款机器人也是一款表情交互机器人,这是香港一家公司出品的机器人。大家可以看一下,美女机器人。完全跟人长的一模一样,不看头我们基本看不出来她是个机器人,她脸上大概有30多个马达,可以模拟200多种表情。
我们不久后会发布一个Bots平台,这个开发平台有中文版有英文版,中文版是小i机器人提供的,欢迎大家到时候使用。
对于小i来说,小i的核心技术是在不断的加速循环。我们有非常多的产业应用,产生了大量的真实的商业数据,数据产生不断的知识,更多的知识促进我们整个产业发展,现在已经进行非常良性的产业循环,也在不断加速。
我们也在探索人工智能、自然语言理解包括机器学习和医疗法律等行业的整合,现在因为做了很多产业的应用,这些产业的应用产生了非常庞大的真实的交互数据,这些数据又通过我们的机器学习的整个学习体系在不断把它抽象化成我们的知识还有语义,这些又促进了我们整个产业应用的发展,正向循环已经形成,现在在不断加速发展。
在整个人工智能的技术布局里面,按照我们的理解,分成三个基本层次,中间层是人工智能的关键技术,经常提到像自然语言理解、智能语音、计算机视觉这些关键技术,它们都有一些共同的技术——机器学习,现在应用最多的是深度学习。这些都要靠底层的计算资源还有数据资源提供基础,关于人工智能技术构建上层的产业应用,今年产业发展状况还不错,目前为止今年的收入会比去年翻150%,比去年增长150%,去年是挂牌新三板,经过严格财务审计的今年收入一定会超过 1 亿,这对我们企业的发展还是一个非常重要的门槛。
这就是我们在人工智能产业里面的一些布局,对于我们来说呢,我们公司不仅仅是做自然语言处理的,在语音,在深度学习,甚至是量子计算方面,我们都有技术研发布局和产业布局。
谢谢大家。
|