小雅OS开放平台文档

小雅OS开放平台文档

  • 快速入门
  • 客户端接入
  • 服务端接入

›概述

概述

  • 平台简介
  • 核心概念
  • 接入流程
  • 创建产品
  • 账号体系
  • 内容页运营
  • 联系我们

核心概念

小雅OS是一个智能语音对话系统。使用人工智能相关技术,将自然语言对话简单便捷的应用于到您的硬件设备。

在了解如何开发之前,先了解以下一些概念。

通信过程

接口结构

系统包含三个部分:中控(API Gateway)、自然语言理解引擎(NLU)、技能(Skill)。

在用户的语音转为文字后,系统将会把相应的文字发给对话中控。对话中控请求语言理解服务,将文字理解为domain/intent结构化数据。然后对话中控将此数据发给技能,技能则会返回执行后的结果,客户端即可对结果进行响应。

除了语音对话,还需要请求其他接口执行其他任务,例如同步播放进度接口,此时接口中控则会像对话中控一样,将客户端发来的domain/intent数据发给技能进行执行,执行结果再返回给客户端。

技能

技能是语音交互的基本单位,定义了对话的语法规则,以及对应的执行逻辑,用承接一段对话的逻辑,完成一组特定的任务。

例如小雅OS已经支持喜马拉雅FM、喜马拉雅儿歌、查天气、查快递等技能。

以喜马拉雅FM技能为例,你可以说:“我想听郭德纲的相声”, “继续播放”, “下一集” 等。将由技能执行相应的动作并返回数据。

Domain/Intent

技能具体执行时,将会有明确的执行对象和执行动作。自然语言的”今天天气怎么样?“为例,执行对象是天气,执行动作是查询,动作的参数是时间:今天。

我们表示为:

{
    "domain": "weather",
    "intent": "get_weather",
    "slots": {
        "time": [
            {
                "slot_type": "TIME",
                "text": "今天",
                "value": {
                    "sub_type": 0,
                    "type": 1,
                    "begin": {
                        "date": {
                            "month": 3,
                            "year": 2019,
                            "day": 20
                        }
                    }
                }
            }
        ]
    }
}

这组数据是由NLU根据”今天天气怎么样“这句话生成,并发给技能去查询和处理,技术侧按照相应的逻辑返回文本即可。文本将由设备再次请求TTS(Text to Speech,语音合成)服务生成语音播放给用户。

这组数据中,有以下概念:

Domain(领域):技能的一个内部概念,用于指明要查询的信息是什么;

Intent(意图):技能等执行的动作,天气领域可以”查天气“,也可以”查空气质量“、”查洗车指数“、”查有没有雨“等,即天气技能包含多个意图;

Slot(槽位):意图的参数,从对话中抽取,例如天气技能的时间槽位可以是”今天“,也可以是”明天“,地点可以是”北京“,也可以是”上海“。

← 平台简介接入流程 →
  • 通信过程
    • 技能
    • Domain/Intent
北京小雅星空科技有限公司 京ICP备19010603号