当前IT领域最热门的科技名词是什么? “人工智能”当之无愧,这个已经存在了数十年的技术领域因为谷歌的Alpha Go人机大战而声名鹊起,从过去的高高在上到今天的人人皆知,人工智能已经无处不在。苹果的Siri, 亚马逊的Echo,谷歌的无人车等都有人工智能技术的身影。
计算机科学的一个分支
人工智能是制造智能机器、可学习计算程序和需要人类智慧解决问题的科学和工程,是计算机科学的一个分支。经典地,这些包括自然语言处理和翻译、视觉感知、模式识别、决策制定等。人造智能是机器能够以我们认为“聪明”的方式执行任务的更广泛的概念。
机器学习(Machine Learning)是AI的一个子领域,机器学习可以创建从数据中学习的算法,然后在遇到新数据时进行预测。机器学习是从案例和经验(例如数据配置)中习得的算法,而不是依赖于硬件、代码和事先定义的规则。机器学习涉及其核心算法,应用高级统计学和数学理论来在数据中执行模式识别。机器学习在我们生活中大量使用,其使用将在未来也将大幅增加,一些例子包括:自驾汽车、语音识别、手写识别、面部识别、光学字符识别、垃圾邮件检测、市场细分、预测、天文学(能够开发关于宇宙形成的理论)、欺诈检测、喷气发动机故障预测。
深度学习(Deep Learning)是机器学习的分集,深度学习的主要发展是现有人工智能拐点的驱动力量之一。深度学习是一种需要训练大型神经网络(Neural Network)的“深层”层次结构,且每层可以解决问题不同方面的机器学习,从而使系统能解决更复杂问题的。神经网络在AI 机器学习的中充当一种模拟人类大脑的计算机体系结构,在其上可以构建AI 机器学习程序。它由聚合的连接节点组成,如人类大脑中的神经元般可以解决更复杂的问题并学习。
监督学习(Supervised Learning)和非监督学习(Unsupervised Learning)是机器学习的两种类型。在监督学习中,系统给出一系列“正确答案”的例子。基于这些例子,系统将从正确的答案中学习什么是对的,从而进行正确预测的输出。监督学习的现实应用包括图像识别(以图片分析为例,对监督学习来说,训练数据里的图片需要被标识为狗、猫或者别的动物,系统通过学习,能够识别其他图片中的狗、猫或者其他动物)。与监督学习不同,非监督学习不需要训练数据被标识,例如非监督学习中的聚类学习,可以把一堆无标识的图片自动聚合成若干类,其中每类分别对应一种动物。
神经网络、深度学习以及之后潜在的技术架构,已经存在了几十年,但是过去的5到10 年,IT领域三个方面发生了巨大的改变:
爆炸性增长的数据
通过分布于全球持续增长无所不在的互相联系的设备、机器和系统产生的非结构化数据的数量呈现巨大的增长。拥有的数据越多,神经网络就变得越有效率,意味着随着数据量的增长,机器语言可以解决的问题的数量也在增长。移动手机、物联网、低耗数据存储的成熟和处理技术(通常在云端)已经在数量、大小、可靠数据结构方面创造了大量的成长。根据IDC的数字领域报告,到2020年,每年数据量将达到44ZB(万亿G),5 年内年复合增长率达到141%,暗示我们刚开始看到这些科技可以达到的应用场景。
更快、更强大的硬件芯片
GPU 的使用、低成本计算能力的普遍化,特别是通过云服务,以及建立新的神经网络模型,已经极大的增加了神经网络产生结果的速度与准确率。GPU 和并行架构要比传统的基于数据中心架构的CPU 能更快的训练机器学习系统。通过使用图像芯片,网络能更快的迭代,能在短期内进行更准确的训练。在2016 年,单张英伟达游戏显卡就有了类似于2002年之前最强大的超级计算机拥有的计算能力。成本也有了极大的降低,英伟达GPU(GTX 1080)有9 TFLOPS 的性能,只要700 美元,意味着每GFLOPS 只要8 美分。在1961 年,要提供1GFLOPS,需要足够多的IBM 1620s 串联在一起,计算下来费用要超过9万亿美元。
更好、更普遍可用的算法
更好的输入(计算和数据)使得更多的研发是面向算法,从而支持深度学习的使用。例如伯克利的Caffe、谷歌的TensorFlow 和Torch 这样的开源框架。刚开源一年多的TensorFlow,已经成为GitHub 上最多分支的框架。虽然不是所有的人工智能都发生于普遍可用的开源框架中,但开源确实在加速发展,而且也有更多先进的工具正在开源。
用户界面(User Interface)的未来
在过去十多年间,移动应用作为企业与客户和员工的互动与参与渠道,在后移动应用时代,我们看到的更多是像微信、Facebook Messenger、WhatsApp、Slack等作为订阅渠道的消息传递渠道。全球有超过41亿用户在即时通讯应用上,采用的速度比社交网络快。这导致了由AI驱动的Chatbots的创新,这将有助于企业通过这些渠道自动化这些对话。Chatbots使用强大的自然语言处理(Natural Language Processing)机器学习算法来了解最终用户意图,并通过处理这些对话并与业务数据集成来回应最终用户来完成业务处理。针对垂直和企业应用场景下,Chatbot已经有很多应用案例,Gartner预测:“Conversational AI-first”将取代“Cloud-first,Mobile-first”,作为未来十年信息战略的最高级别。机器人的兴起与诸如Facebook Messenger、WhatsApp以及面向企业的Slack和HipChat 等消息应用的快速增长同步。消息应用程序提供了一种媒介,通过它,机器人可以与iOS,Android 和网络上的用户进行交互。此外,更大的消息应用正在发展成支持多种交互类型的平台。在Slack 上,企业用户可能与团队合作,监控应用程序,创建待办事项列表或从同一接口监控费用。在微信聊天程序中,能够利用同一个界面,用户可以与朋友聊天,提出品牌的支持问题或进行出租车预约、预定外卖等等。
在以机器人为中心的世界,用户体验从基于点击的行为转向会话(文本或者语音)以及互动从网络或面向应用转向消息或语音平台。换句话说,相比之前的打开三个不同的应用程序分别预约旅行、购买衣服以及参与客户服务,而现在用户只需要通过会话提供信息给提供帮助的机器人,从而完成同样的事情。因此,我们能看到这些对电子商务、客户支持、员工工作流程及工作效率的广泛影响。机器人的期望植根于他们智能或处理自然语言的潜力。因此伴随着机器学习、自然语言处理的人工智能技术、计算机理解、以及语义理解兴趣和创新的兴起,对机器人的兴趣也在兴起。相比过去的文字处理方式,与基于硬编码规则集构建的函数操作的处理操作相反,NLP 利用机器学习算法来基于海量训练数据来学习规则,然后可以将其应用于新的文本集。机器学习的核心原则同样适用于NLP,获取的数据越多,其应用程序就越准确和更广泛。
Intelligent Bots Cloud Service (IBCS)介绍
甲骨文在IT创新领域持续投入,并通过使用机器学习算法的智能聊天机器人功能扩展甲骨文云服务,帮助客户通过Chatbots与用户和员工互动。在用户处理自然语言的解决方案中有多种机器学习算法,聊天机器人的自我和深度学习算法随着对话的增长而不断变得更加智能,通过算法来了解用户情绪、翻译语言等。甲骨文智能机器人云服务建立在微服务架构上,每个Machine Learning引擎作为微服务运行。IBCS的渠道框架与微信、Facebook Messenger、WhatsApp、Native移动应用程序、基于Web的应用程序集成在一起,自然语言处理 NLP 微服务处理该功能的语言识别方面。 任何想要构建使用NLP服务的应用程序的开发人员都可以调用相同的NLP服务,这种架构允许我们开始向希望在其应用场景中使用特定机器学习算法的开发人员提供AIaaS服务。
甲骨智能机器人云服务四大关键组件
IBCS使用一系列基于神经网络(Neural Networks)的技术,使用语言事件和语言建模通过自然语言处理(Natural Language Processing)技术来提高处理最终用户输入的内容的准确性,这使得Bot开发者专注于配置Bot业务流程,而不是花费大量的修改算法,调试模型参数。
IBCS公开了多种自然语言理解(Natural Language Understanding)模型,以便从传入的Bot请求中预测用户意图,并准确执行所需的对话流程。为了实现这一点,我们利用多种自然语言处理(NLP)和机器学习(ML)算法对最终用户意图进行分类。这些方法描述如下:
对于数据量低的应用场景,IBCS第一类模型(Trainer Ht)通过NLP语言学的生成规则模板的组合,通过提供一小组数据(语料库)来帮助客户快速入门模型训练。使用该模型的用户意图预测对于类似于Bot语料库中提供的话语的传入请求是高度准确的。
对于具有大容量数据集并且需要更好地概括意图预测的应用场景,IBCS为用户意图预测提供了更先进的机器学习(ML)模型,第二类模型(Trainer Tm)利用从大量未标记的文本(例如WSJ,NYT,Wikipedia,Reuters等)学习无监督的算法的组合,然后基于语料库产生用户意图预测的上下文敏感的映射或向量。
通过以上两种方法,客户可以快速入门,然后使用强大的机器学习模型在初始语料库中构建,以便在数据集增长时更准确地预测使用意图。
除了上述之外自然语言处理算法应用之外,还有其他一些算法,理解用户情绪、图像分析、自动补全等人工智能解决方案,给用户更多选择。
客户化组件是通过REST API暴露的一组服务,客户化组件是可重用的工作单元,可以在NodeJS容器中编写的业务逻辑,开发人员可以通过IBCS为机器人所需的各种个性化功能构建客户化组件,还可以访问后端服务来查询数据和写入数据。甲骨文是企业和云数据集成的领导者,同时也提供了开箱即用的REST API, Oracle PaaS之一的集成云服务(ICS),集成了超过75多个企业和非企业后端系统,IBCS客户化组件可以通过ICS与企业后端应用及数据相连,为企业提供强大的企业服务能力。
当前有多个渠道具有不同的集成接口,开发人员可能需要花费大量的时间和精力来了解这些接口,像微信、FB Messenger、Skype、Line、Slack等即时消息软件,如Amazon Alexa、Google Home等虚拟个人助手,像科大讯飞、Siri,Cortana等语音接口,了解这些渠道哪些特性支持哪些特性不支持,同时现有的移动应用和网页的聊天界面的扩展,用户可以通过BOT与客户服务人员进行交流。 这些渠道处理排队,路由,速率限制,回退,重试,正常运行时间,错误和异常等等。 IBCS为开发人员提供了一个抽象的整合,将其整合到这些渠道中。 这降低了部署速度,提供更加敏捷的开发运维体验。
IBCS为开发人员提供一种简单的方法来构建对话对话流程 - 与最终用户的对话。最终用户在人际交往的过程中可能会分支到不同的状态/上下文,平台通过内置状态管理非常容易地对其进行建模,因此开发人员可以通过”零代码”或者”低代码”维护这个机器人交互流程。
本文简要介绍了甲骨文提供的智能机器人云服务Intelligent Bots Cloud Service (IBCS) ,欲了解更多信息,请访问www.oracle.com/bots, 使用IBCS快速构建满足需求的智能机器人。

作者简介
向志华,Oracle云平台高级售前顾问,专注 Application PaaS 产品及服务,同时关注Docker容器产品及Kubernetes容器调度产品方向。13年IT行业从业经验,擅长J2EE产品架构及开发,参与过OpenStack相关产品研发工作。您可以通过george.xiang@oracle.com,与他联系。
了解更多,敬请关注甲骨文开发者社区......