类 AICloudASRIntent
- java.lang.Object
-
- com.aispeech.export.intent.AICloudASRIntent
-
public class AICloudASRIntent extends java.lang.Object
-
-
嵌套类概要
嵌套类 修饰符和类型 类 说明 static class
AICloudASRIntent.PCM_ENCODE_TYPE
音频编码类型
-
构造器概要
构造器 构造器 说明 AICloudASRIntent()
-
方法概要
所有方法 实例方法 具体方法 已过时的方法 修饰符和类型 方法 说明 AICloudASRIntent.PCM_ENCODE_TYPE
getAudioType()
org.json.JSONArray
getCommonWakeupWord()
java.lang.String
getConstantContent()
java.lang.String
getContextId()
如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须int
getCustomWakeupScore()
org.json.JSONArray
getCustomWakeupWord()
java.lang.String
getDeviceId()
org.json.JSONObject
getDmAsrJson()
java.lang.String
getDomain()
领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置java.util.Map<java.lang.String,java.lang.Object>
getExtraParam()
IFespxEngine
getFespxEngine()
java.lang.String
getGroupId()
java.lang.String[]
getHotWords()
int
getIgnoreEmptyResultCounts()
int
getIntervalTimeThresh()
java.lang.String
getLanguage()
java.lang.String
getLmId()
java.lang.String[]
getLmList()
java.lang.Boolean
getLocalVadEnable()
int
getMaxSpeechTimeS()
float
getMinSpeechLength()
最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值int
getNbest()
int
getNoSpeechTimeOut()
OneshotCache<byte[]>
getOneshotCache()
java.lang.String[]
getOneshotOptimizationFilterWords()
java.lang.String
getOrganization()
int
getPauseTime()
org.json.JSONArray
getPhraseHintsJsonArray()
java.lang.String
getProductId()
java.lang.String
getResourceType()
java.lang.String
getSaveAudioPath()
int
getSelfCustomWakeupScore()
java.lang.String
getServer()
java.lang.String
getServerName()
java.lang.String
getUserId()
java.util.List<java.lang.String>
getUsers()
int
getWaitingTimeout()
java.lang.String
getWakeupWord()
java.lang.String
getWssDMCustomParams()
boolean
isCloudVadEnable()
boolean
isCloudVprintVadEnable()
boolean
isEnableAlignment()
boolean
isEnableAudioDetection()
boolean
isEnableConfidence()
boolean
isEnableDialectProcess()
boolean
isEnableDialectProcessNlurec()
boolean
isEnableEmotion()
boolean
isEnableFirstDec()
boolean
isEnableFirstDecForce()
boolean
isEnableLanguageClassifier()
boolean
isEnableNumberConvert()
boolean
isEnablePunctuation()
boolean
isEnableRecUppercase()
boolean
isEnableSensitiveWdsNorm()
boolean
isEnableSNTime()
boolean
isEnableTone()
boolean
isEncodedAudio()
boolean
isIgnoreEmptyResult()
boolean
isOneshotOptimization()
boolean
isRealback()
boolean
isSaveOriginalAudio()
boolean
isUseCustomFeed()
boolean
isUseDmAsr()
boolean
isUseOneShot()
boolean
isUseStrongWakeupVisible()
boolean
isWakeupWordFilter()
void
putExtraParam(java.lang.String key, java.lang.Object value)
设置额外的参数,以 key:value 的形式发送给服务器。void
setAudioType(AICloudASRIntent.PCM_ENCODE_TYPE audioType)
设置 PCM 编码成其它格式,以减小传输大小。void
setCloudVadEnable(boolean cloudVadEnable)
设置是否开启服务端的vad功能,一般近场关闭,远场打开void
setCloudVprintVadEnable(boolean cloudVprintVadEnable)
void
setCommonWakeupWord(org.json.JSONArray commonWakeupWord)
配置自定义唤醒词;等价customWakeupWordvoid
setConstantContent(java.lang.String constantContent)
标记语音中已知的固定的文本内容(如唤醒词),算法会特殊处理被标记的音频。void
setContextId(java.lang.String contextId)
如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须void
setCustomWakeupScore(int customWakeupScore)
void
setCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord)
设置自定义唤醒词,可用于过滤和指定唤醒词识别比如 ["你好小乐","你好小白"]void
setCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord, boolean filter)
设置自定义唤醒词和 是否过滤句首唤醒词,用于 oneshot 功能。void
setDeviceId(java.lang.String deviceId)
已过时。不再使用void
setDomain(java.lang.String domain)
领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置void
setEnableAlignment(boolean enableAlignment)
void
setEnableAudioDetection(boolean enableAudioDetection)
void
setEnableConfidence(boolean enableConfidence)
设置置信度void
setEnableDialectProcess(boolean enableDialectProcess)
void
setEnableDialectProcessNlurec(boolean enableDialectProcessNlurec)
void
setEnableEmotion(boolean enableEmotion)
是否开启情感识别void
setEnableFirstDec(boolean enableFirstDec)
首字延时优化void
setEnableFirstDecForce(boolean enableFirstDecForce)
vad=false时强制开首字优化void
setEnableLanguageClassifier(boolean enableLanguageClassifier)
已过时。无效参数,废弃void
setEnableNumberConvert(boolean enableNumberConvert)
设置是否启用识别结果汉字数字转阿拉伯数字功能void
setEnablePunctuation(boolean enablePunctuation)
设置是否启用标点符号识别void
setEnableRecUppercase(boolean enableRecUppercase)
输出英文字母转成大写,true 为转大写,false 为不转大写。void
setEnableSensitiveWdsNorm(boolean enableSensitiveWdsNorm)
敏感词过滤 true 是开启,false 是关闭 默认是开启void
setEnableSNTime(boolean enableSNTime)
设置rec结果增加对齐信息,默认为false,关闭void
setEnableTone(boolean enableTone)
设置音调功能,默认为false,关闭void
setExtraParam(java.util.Map<java.lang.String,java.lang.Object> extraParam)
设置额外的参数void
setFespxEngine(IFespxEngine fespxEngine)
设置关联 IFespxEngine 实例,只在使用内部录音机且多麦模式下才需要设置void
setGroupId(java.lang.String groupId)
void
setHotWords(java.lang.String[] hotWords)
设置产品级热词,比如"你好小驰"设置之后,识别的同音词都会被识别为 你好小驰 ["你好小驰","思必驰"]void
setIgnoreEmptyResult(boolean ignoreEmptyResult)
设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别void
setIgnoreEmptyResult(boolean ignoreEmptyResult, int ignoreEmptyResultCounts)
设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别void
setLanguage(java.lang.String language)
指定语种,默认中文("zh-cn")。void
setLmId(java.lang.String lmId)
设置识别lmidvoid
setLmList(java.lang.String[] lmList)
设置用户定制的语言模型列表void
setLocalVadEnable(java.lang.Boolean localVadEnable)
设置是否启用本地vad。void
setMaxSpeechTimeS(int seconds)
设置音频最大录音时长,达到该值将取消语音引擎并抛出异常
允许的最大录音时长 单位秒 0 表示无最大录音时长限制 默认大小为60Svoid
setMinSpeechLength(float minSpeechLength)
最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值void
setNbest(int nbest)
设置 nbestvoid
setNoSpeechTimeOut(int milliSecond)
设置无语音超时时长,单位毫秒,默认值为5000ms ;如果达到该设置值时,自动停止录音 设置为0表示不进行语音超时判断void
setOneshotCache(OneshotCache<byte[]> oneshotCache)
void
setOneshotOptimization(boolean oneshotOptimization)
初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别void
setOneshotOptimization(boolean oneshotOptimization, java.lang.String[] oneshotOptimizationFilterWords)
初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别。void
setPauseTime(int pauseTime)
设置VAD右边界void
setPhraseHints(PhraseHints[] phraseHints)
设置请求级热词,一般和用户的训练集一起搭配使用。void
setProductId(java.lang.String productId)
已过时。不再使用void
setRealback(boolean realback)
设置是否使用实时反馈功能void
setResourceType(java.lang.String type)
设置识别引擎的资源类型,默认为comm 通用:comm 车载:aicar 机器人:airobot 家居:aihome 英文:aienglish 中英混:aienglish-mix 电视:aitvvoid
setSaveAudioPath(java.lang.String saveAudioPath)
设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"void
setSaveAudioPath(java.lang.String saveAudioPath, boolean saveOriginalAudio)
设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"void
setSelfCustomWakeupScore(int selfCustomWakeupScore)
自定义唤醒词自定义分数设置,因该参数会影响识别唤醒词的效果同时会增加误识别风险, 建议在专业人士指导下定制自定义分数(建议给-5), 该项可以配合 wakeupWord/customWakeupWord 使用void
setServer(java.lang.String server)
设置服务器地址,默认不用设置void
setUseCustomFeed(boolean useCustomFeed)
设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord)void
setUseCustomFeed(boolean useCustomFeed, boolean encodedAudio)
设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord) feed 的音频如果不是pcm音频,则不能使用 vad 功能void
setUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson)
void
setUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson, java.lang.String dmWssCustomparams)
是否是对话用的ASR,用于对话使用,使用单独的请求参数void
setUseOneShot(boolean useOneShot)
是否使用oneshot功能,default is false
true 使用one shot功能,唤醒后立马起识别
false 不使用oneshot,合成后启动识别,或只是启动识别void
setUseOneShot(boolean useOneShot, int intervalTimeThresh)
设置是否使用oneshot功能,以及oneshot功能的唤醒词和命令词之间的时间间隔阈值, 如果小于该阈值,就认为不是oneshot,如果大于该阈值,就认为是oneshotvoid
setUserId(java.lang.String userId)
设置用户标示void
setUseStrongWakeupVisible(boolean useStrongWakeupVisible)
default is 使用场景:开启oneShot功能,开启实时返回,识别结果会有唤醒词或者是唤醒词前面有其他杂音情况。void
setVprintInfo(java.lang.String serverName, java.util.List<java.lang.String> users, java.lang.String organization)
设置要验证的声纹信息void
setWaitingTimeout(int waitingTimeout)
设置等待识别结果超时时间 单位毫秒,小于或等于0则不设置超时,默认5000ms.void
setWakeupWord(java.lang.String wakeupWord)
配置自定义唤醒词功能;配合唤醒词分数使用可增强唤醒词识别,同时结果中过滤所传唤醒词; 如果同时设置commonWakeupWord,仍会过滤唤醒词,但唤醒词的增强识别会生效java.lang.String
toString()
-
-
-
方法详细资料
-
getOneshotCache
public OneshotCache<byte[]> getOneshotCache()
-
getDeviceId
public java.lang.String getDeviceId()
-
getProductId
public java.lang.String getProductId()
-
setOneshotCache
public void setOneshotCache(OneshotCache<byte[]> oneshotCache)
-
setDeviceId
@Deprecated public void setDeviceId(java.lang.String deviceId)
已过时。不再使用设置deviceId,需要和授权时设置的一样,建议不做外部传参,由SDK内部统一规划,不再做版本向前兼容- 参数:
deviceId
-
-
setProductId
@Deprecated public void setProductId(java.lang.String productId)
已过时。不再使用设置productId,需要和授权时设置的一样,建议不做外部传参,由SDK内部统一规划,不再做版本向前兼容- 参数:
productId
-
-
isEnableRecUppercase
public boolean isEnableRecUppercase()
-
setEnableRecUppercase
public void setEnableRecUppercase(boolean enableRecUppercase)
输出英文字母转成大写,true 为转大写,false 为不转大写。默认 true- 参数:
enableRecUppercase
- true/false
-
isEnableSensitiveWdsNorm
public boolean isEnableSensitiveWdsNorm()
-
setEnableSensitiveWdsNorm
public void setEnableSensitiveWdsNorm(boolean enableSensitiveWdsNorm)
敏感词过滤 true 是开启,false 是关闭 默认是开启- 参数:
enableSensitiveWdsNorm
-
-
getCustomWakeupScore
public int getCustomWakeupScore()
-
setCustomWakeupScore
public void setCustomWakeupScore(int customWakeupScore)
-
isEnableEmotion
public boolean isEnableEmotion()
-
isEnableFirstDec
public boolean isEnableFirstDec()
-
setEnableFirstDec
public void setEnableFirstDec(boolean enableFirstDec)
首字延时优化- 参数:
enableFirstDec
- 默认是false
-
isEnableFirstDecForce
public boolean isEnableFirstDecForce()
-
setEnableFirstDecForce
public void setEnableFirstDecForce(boolean enableFirstDecForce)
vad=false时强制开首字优化- 参数:
enableFirstDecForce
- 默认是false
-
setEnableEmotion
public void setEnableEmotion(boolean enableEmotion)
是否开启情感识别- 参数:
enableEmotion
- true 开启,false 不开(default)
-
isUseStrongWakeupVisible
public boolean isUseStrongWakeupVisible()
-
setUseStrongWakeupVisible
public void setUseStrongWakeupVisible(boolean useStrongWakeupVisible)
default is 使用场景:开启oneShot功能,开启实时返回,识别结果会有唤醒词或者是唤醒词前面有其他杂音情况。 目前出现此类问题是sspe送回来的音频回滚时间较长 或者三方送入的音频唤醒词前音频较长,导致唤醒词前面数据也会带入 开启此功能,云端进行过滤,xxx(唤醒词) 0. 不包含xxx => “” 1. xxx => “” 2. 123xxx => “” 3. xxx456 => “456” 4. 123xxx456 => “456” 新增输出接口"strong_wakeup_filtered",在eof=1时输出,具体如下: var部分: (1) var正常进行唤醒词过滤,若第一个rec片段对应的var匹配到唤醒词,过滤唤醒词及之前的内容,且后续的rec片段对应的var不需要再过滤; (2) 如果第一个rec片段对应的var配有匹配到唤醒词,则后续的rec片段对应的var继续匹配和过滤; rec部分: (1) 限制仅在第一个rec片段实现唤醒词匹配过滤,若匹配到唤醒词,则在eof=1的rec片段输出中,加入"strong_wakeup_filtered"=1的标记,若没有匹配到,则标记为0; (2) 第一个rec和nlu_rec如果匹配到唤醒词,则正常过滤,没有匹配到,则输出原文本,其他rec和nlu_rec的内容不受过滤影响,可以正常输出; Note: 这个功能与唤醒词后置功能互斥 ,需要与setWakeupWord 一起使用- 参数:
useStrongWakeupVisible
- true,开启特殊唤醒词过滤功能,强制过滤唤醒词及之前内容; false 关闭特殊唤醒词过滤
-
isEnableDialectProcess
public boolean isEnableDialectProcess()
-
setEnableDialectProcess
public void setEnableDialectProcess(boolean enableDialectProcess)
-
isEnableDialectProcessNlurec
public boolean isEnableDialectProcessNlurec()
-
setEnableDialectProcessNlurec
public void setEnableDialectProcessNlurec(boolean enableDialectProcessNlurec)
-
getPhraseHintsJsonArray
public org.json.JSONArray getPhraseHintsJsonArray()
-
isUseDmAsr
public boolean isUseDmAsr()
-
setUseDmAsr
public void setUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson)
-
getWakeupWord
public java.lang.String getWakeupWord()
-
setWakeupWord
public void setWakeupWord(java.lang.String wakeupWord)
配置自定义唤醒词功能;配合唤醒词分数使用可增强唤醒词识别,同时结果中过滤所传唤醒词; 如果同时设置commonWakeupWord,仍会过滤唤醒词,但唤醒词的增强识别会生效- 参数:
wakeupWord
-
-
getCommonWakeupWord
public org.json.JSONArray getCommonWakeupWord()
-
setCommonWakeupWord
public void setCommonWakeupWord(org.json.JSONArray commonWakeupWord)
配置自定义唤醒词;等价customWakeupWord- 参数:
commonWakeupWord
-
-
setUseDmAsr
public void setUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson, java.lang.String dmWssCustomparams)
是否是对话用的ASR,用于对话使用,使用单独的请求参数- 参数:
dmAsrJson
- dmAsrjsonuseDmAsr
- use dm asrdmWssCustomparams
- 是否使用鉴权参数
-
getWssDMCustomParams
public java.lang.String getWssDMCustomParams()
-
getDmAsrJson
public org.json.JSONObject getDmAsrJson()
-
setPhraseHints
public void setPhraseHints(PhraseHints[] phraseHints)
设置请求级热词,一般和用户的训练集一起搭配使用。如果已经关联了对应的模型,则不需要设置模型IDsetLmId(String)
setLmList(String[])
aiCloudASRIntent.setPhraseHints(new PhraseHints[]{new PhraseHints("city", new String[]{"海上明月生"})});
- 参数:
phraseHints
- 请求级热词列表
-
getFespxEngine
public IFespxEngine getFespxEngine()
-
setFespxEngine
public void setFespxEngine(IFespxEngine fespxEngine)
设置关联 IFespxEngine 实例,只在使用内部录音机且多麦模式下才需要设置- 参数:
fespxEngine
- 引擎实例- 抛出:
java.lang.RuntimeException
- 内部录音机且多麦模式下没设置
-
getHotWords
public java.lang.String[] getHotWords()
-
setHotWords
public void setHotWords(java.lang.String[] hotWords)
设置产品级热词,比如"你好小驰"设置之后,识别的同音词都会被识别为 你好小驰 ["你好小驰","思必驰"]- 参数:
hotWords
- 产品级热词列表
-
setSaveAudioPath
public void setSaveAudioPath(java.lang.String saveAudioPath, boolean saveOriginalAudio)
设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"- 参数:
saveAudioPath
- 文件路径saveOriginalAudio
- 是否保存从start到stop所有的音频,default is false
-
setUseOneShot
public void setUseOneShot(boolean useOneShot, int intervalTimeThresh)
设置是否使用oneshot功能,以及oneshot功能的唤醒词和命令词之间的时间间隔阈值, 如果小于该阈值,就认为不是oneshot,如果大于该阈值,就认为是oneshot- 参数:
useOneShot
- true 使用 oneshot功能,false 不使用intervalTimeThresh
- useOneShot 为 true 时才有效,单位:毫秒,默认为600ms。
-
getNoSpeechTimeOut
public int getNoSpeechTimeOut()
-
setNoSpeechTimeOut
public void setNoSpeechTimeOut(int milliSecond)
设置无语音超时时长,单位毫秒,默认值为5000ms ;如果达到该设置值时,自动停止录音 设置为0表示不进行语音超时判断- 参数:
milliSecond
- 超时时长,单位毫秒- 另请参阅:
SpeechParams.setNoSpeechTimeout(int)
-
getMaxSpeechTimeS
public int getMaxSpeechTimeS()
-
setMaxSpeechTimeS
public void setMaxSpeechTimeS(int seconds)
设置音频最大录音时长,达到该值将取消语音引擎并抛出异常
允许的最大录音时长 单位秒- 0 表示无最大录音时长限制
- 默认大小为60S
- 参数:
seconds
- seconds- 另请参阅:
SpeechParams.setMaxSpeechTimeS(int)
-
getSaveAudioPath
public java.lang.String getSaveAudioPath()
-
setSaveAudioPath
public void setSaveAudioPath(java.lang.String saveAudioPath)
设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"- 参数:
saveAudioPath
- 文件路径
-
isSaveOriginalAudio
public boolean isSaveOriginalAudio()
-
getWaitingTimeout
public int getWaitingTimeout()
-
setWaitingTimeout
public void setWaitingTimeout(int waitingTimeout)
设置等待识别结果超时时间 单位毫秒,小于或等于0则不设置超时,默认5000ms. 从vad结束或者用户主动调用stop方法开始计时- 参数:
waitingTimeout
- 超时时长
-
getIntervalTimeThresh
public int getIntervalTimeThresh()
-
isUseOneShot
public boolean isUseOneShot()
-
setUseOneShot
public void setUseOneShot(boolean useOneShot)
是否使用oneshot功能,default is false
true 使用one shot功能,唤醒后立马起识别
false 不使用oneshot,合成后启动识别,或只是启动识别- 参数:
useOneShot
- true 使用 oneshot功能,false 不使用
-
getPauseTime
public int getPauseTime()
-
setPauseTime
public void setPauseTime(int pauseTime)
设置VAD右边界- 参数:
pauseTime
- pauseTime 单位为ms,默认为300ms
-
getLmList
public java.lang.String[] getLmList()
-
setLmList
public void setLmList(java.lang.String[] lmList)
设置用户定制的语言模型列表- 参数:
lmList
- 语言模型列表
-
setCustomWakeupWord
public void setCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord, boolean filter)
设置自定义唤醒词和 是否过滤句首唤醒词,用于 oneshot 功能。 比如音频输入为"你好小驰,今天天气怎么样",filter 为 true 后识别结果即为"今天天气怎么样"- 参数:
customWakeupWord
- 自定义唤醒词 ["你好小弛"]filter
- false (default)不过滤, true 过滤
-
getLanguage
public java.lang.String getLanguage()
-
setLanguage
public void setLanguage(java.lang.String language)
指定语种,默认中文("zh-cn")。需要 res 支持语种- 参数:
language
- 语种
-
setUseCustomFeed
public void setUseCustomFeed(boolean useCustomFeed, boolean encodedAudio)
设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord) feed 的音频如果不是pcm音频,则不能使用 vad 功能- 参数:
useCustomFeed
- 设置是否自行feed数据,默认falseencodedAudio
- feed的音频是否是编码成 MP3 OGG OPUS OGG_OPUS 等音频的
-
isEncodedAudio
public boolean isEncodedAudio()
-
getServer
public java.lang.String getServer()
-
setServer
public void setServer(java.lang.String server)
设置服务器地址,默认不用设置- 参数:
server
- 服务器地址,包含ws://
-
getUserId
public java.lang.String getUserId()
-
setUserId
public void setUserId(java.lang.String userId)
设置用户标示- 参数:
userId
- 用户标示
-
getLmId
public java.lang.String getLmId()
-
setLmId
public void setLmId(java.lang.String lmId)
设置识别lmid- 参数:
lmId
- custom lmid
-
isEnablePunctuation
public boolean isEnablePunctuation()
-
setEnablePunctuation
public void setEnablePunctuation(boolean enablePunctuation)
设置是否启用标点符号识别- 参数:
enablePunctuation
- 默认为false
-
isEnableNumberConvert
public boolean isEnableNumberConvert()
-
setEnableNumberConvert
public void setEnableNumberConvert(boolean enableNumberConvert)
设置是否启用识别结果汉字数字转阿拉伯数字功能- 参数:
enableNumberConvert
- 默认为false
-
getSelfCustomWakeupScore
public int getSelfCustomWakeupScore()
-
setSelfCustomWakeupScore
public void setSelfCustomWakeupScore(int selfCustomWakeupScore)
自定义唤醒词自定义分数设置,因该参数会影响识别唤醒词的效果同时会增加误识别风险, 建议在专业人士指导下定制自定义分数(建议给-5), 该项可以配合 wakeupWord/customWakeupWord 使用- 参数:
selfCustomWakeupScore
- 自定义唤醒词得分
-
getCustomWakeupWord
public org.json.JSONArray getCustomWakeupWord()
-
setCustomWakeupWord
public void setCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord)
设置自定义唤醒词,可用于过滤和指定唤醒词识别比如 ["你好小乐","你好小白"]- 参数:
customWakeupWord
- customWakeupWord
-
isWakeupWordFilter
public boolean isWakeupWordFilter()
-
isEnableTone
public boolean isEnableTone()
-
setEnableTone
public void setEnableTone(boolean enableTone)
设置音调功能,默认为false,关闭- 参数:
enableTone
- enableTone
-
isEnableLanguageClassifier
public boolean isEnableLanguageClassifier()
-
setEnableLanguageClassifier
@Deprecated public void setEnableLanguageClassifier(boolean enableLanguageClassifier)
已过时。无效参数,废弃设置语言分类功能,默认为false,关闭- 参数:
enableLanguageClassifier
- enableLanguageClassifier
-
isEnableSNTime
public boolean isEnableSNTime()
-
setEnableSNTime
public void setEnableSNTime(boolean enableSNTime)
设置rec结果增加对齐信息,默认为false,关闭- 参数:
enableSNTime
- enableSNTime
-
getResourceType
public java.lang.String getResourceType()
-
setResourceType
public void setResourceType(java.lang.String type)
设置识别引擎的资源类型,默认为comm 通用:comm 车载:aicar 机器人:airobot 家居:aihome 英文:aienglish 中英混:aienglish-mix 电视:aitv- 参数:
type
- 资源类型
-
isRealback
public boolean isRealback()
-
setRealback
public void setRealback(boolean realback)
设置是否使用实时反馈功能- 参数:
realback
- realback 默认为false
-
isCloudVadEnable
public boolean isCloudVadEnable()
-
setCloudVadEnable
public void setCloudVadEnable(boolean cloudVadEnable)
设置是否开启服务端的vad功能,一般近场关闭,远场打开- 参数:
cloudVadEnable
- cloudVadEnable 默认为true
-
isUseCustomFeed
public boolean isUseCustomFeed()
-
setUseCustomFeed
public void setUseCustomFeed(boolean useCustomFeed)
设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord)- 参数:
useCustomFeed
- the useCustomFeed to set
-
getNbest
public int getNbest()
-
setNbest
public void setNbest(int nbest)
设置 nbest- 参数:
nbest
- nbest,默认为0
-
setEnableAlignment
public void setEnableAlignment(boolean enableAlignment)
-
setEnableAudioDetection
public void setEnableAudioDetection(boolean enableAudioDetection)
-
isEnableAlignment
public boolean isEnableAlignment()
-
isEnableAudioDetection
public boolean isEnableAudioDetection()
-
isOneshotOptimization
public boolean isOneshotOptimization()
-
setOneshotOptimization
public void setOneshotOptimization(boolean oneshotOptimization)
初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别- 参数:
oneshotOptimization
- true 优化,false 不优化(default)
-
setOneshotOptimization
public void setOneshotOptimization(boolean oneshotOptimization, java.lang.String[] oneshotOptimizationFilterWords)
初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别。- 参数:
oneshotOptimization
- true 优化,false 不优化(default)oneshotOptimizationFilterWords
- oneshot优化功能打开后,第一轮识别时可以过滤一些无意义的词,比如:呃,嗯
-
getOneshotOptimizationFilterWords
public java.lang.String[] getOneshotOptimizationFilterWords()
-
getAudioType
public AICloudASRIntent.PCM_ENCODE_TYPE getAudioType()
-
setAudioType
public void setAudioType(AICloudASRIntent.PCM_ENCODE_TYPE audioType)
设置 PCM 编码成其它格式,以减小传输大小。 云端识别需要将PCM音频编译成其它音频格式发送给服务器。- 参数:
audioType
- PCM 编码成其它格式
-
getExtraParam
public java.util.Map<java.lang.String,java.lang.Object> getExtraParam()
-
setExtraParam
public void setExtraParam(java.util.Map<java.lang.String,java.lang.Object> extraParam)
设置额外的参数- 参数:
extraParam
- 额外的参数
-
putExtraParam
public void putExtraParam(java.lang.String key, java.lang.Object value)
设置额外的参数,以 key:value 的形式发送给服务器。 例如:["abc":"ABC","num":123,"bb":false,"list":["a","1","c"]]- 参数:
key
- key,例如:"abc" "num" "list"value
- value,例如:"ABC" 123 false ["a","1","c"]
-
isEnableConfidence
public boolean isEnableConfidence()
-
setEnableConfidence
public void setEnableConfidence(boolean enableConfidence)
设置置信度- 参数:
enableConfidence
- 置信度,默认为true
-
getLocalVadEnable
public java.lang.Boolean getLocalVadEnable()
-
setLocalVadEnable
public void setLocalVadEnable(java.lang.Boolean localVadEnable)
设置是否启用本地vad。启用前提是AICloudASRConfig.isLocalVadEnable()
为true,否则该参数无效。 此参数可设置本轮start的引擎是否使用vad功能- 参数:
localVadEnable
- null 使用和AICloudASRConfig.isLocalVadEnable()
一样的设置, true 使用Vad, false 禁止Vad
-
isIgnoreEmptyResult
public boolean isIgnoreEmptyResult()
-
setIgnoreEmptyResult
public void setIgnoreEmptyResult(boolean ignoreEmptyResult)
设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别- 参数:
ignoreEmptyResult
- 是否忽略空结果,默认为false
-
getIgnoreEmptyResultCounts
public int getIgnoreEmptyResultCounts()
-
setIgnoreEmptyResult
public void setIgnoreEmptyResult(boolean ignoreEmptyResult, int ignoreEmptyResultCounts)
设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别- 参数:
ignoreEmptyResult
- 是否忽略空结果,默认为falseignoreEmptyResultCounts
- 忽略空结果的重试次数,默认为3
-
toString
public java.lang.String toString()
- 覆盖:
toString
在类中java.lang.Object
-
getConstantContent
public java.lang.String getConstantContent()
-
setConstantContent
public void setConstantContent(java.lang.String constantContent)
标记语音中已知的固定的文本内容(如唤醒词),算法会特殊处理被标记的音频。在dp-sr、sti-sr 算法中,会触发使用定制的文本相关模型,替代通用的文本无关模型,提升声纹的识别率。- 参数:
constantContent
- 固定的文本内容
-
setVprintInfo
public void setVprintInfo(java.lang.String serverName, java.util.List<java.lang.String> users, java.lang.String organization)
设置要验证的声纹信息- 参数:
serverName
- 声纹的服务名 vpr和sdrusers
- 要验证的 userId 列表,userId 即注册声纹时的 userIdorganization
- 用户所在的公司,项目
-
getGroupId
public java.lang.String getGroupId()
-
setGroupId
public void setGroupId(java.lang.String groupId)
-
getServerName
public java.lang.String getServerName()
-
getOrganization
public java.lang.String getOrganization()
-
getUsers
public java.util.List<java.lang.String> getUsers()
-
isCloudVprintVadEnable
public boolean isCloudVprintVadEnable()
-
setCloudVprintVadEnable
public void setCloudVprintVadEnable(boolean cloudVprintVadEnable)
-
getDomain
public java.lang.String getDomain()
领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置- 返回:
- 返回当前domain
-
setDomain
public void setDomain(java.lang.String domain)
领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置- 参数:
domain
- 设置domain
-
getContextId
public java.lang.String getContextId()
如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须- 返回:
- 返回当前contextID,判断是否是同一个验证
-
setContextId
public void setContextId(java.lang.String contextId)
如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须- 参数:
contextId
- 用于校验是否是同一个验证
-
getMinSpeechLength
public float getMinSpeechLength()
最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值- 返回:
- 返回最小有效音频长度
-
setMinSpeechLength
public void setMinSpeechLength(float minSpeechLength)
最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值- 参数:
minSpeechLength
- 设置最小有效音频长度
-
-