类 AICloudASRIntent
- java.lang.Object
-
- com.aispeech.export.intent.AICloudASRIntent
-
public class AICloudASRIntent extends java.lang.Object
-
-
嵌套类概要
嵌套类 修饰符和类型 类 说明 static classAICloudASRIntent.PCM_ENCODE_TYPE音频编码类型
-
构造器概要
构造器 构造器 说明 AICloudASRIntent()
-
方法概要
所有方法 实例方法 具体方法 已过时的方法 修饰符和类型 方法 说明 AICloudASRIntent.PCM_ENCODE_TYPEgetAudioType()org.json.JSONArraygetCommonWakeupWord()java.lang.StringgetConstantContent()java.lang.StringgetContextId()如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须intgetCustomWakeupScore()org.json.JSONArraygetCustomWakeupWord()java.lang.StringgetDeviceId()org.json.JSONObjectgetDmAsrJson()java.lang.StringgetDomain()领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置java.util.Map<java.lang.String,java.lang.Object>getExtraParam()IFespxEnginegetFespxEngine()java.lang.StringgetGroupId()java.lang.String[]getHotWords()intgetIgnoreEmptyResultCounts()intgetIntervalTimeThresh()java.lang.StringgetLanguage()java.lang.StringgetLmId()java.lang.String[]getLmList()java.lang.BooleangetLocalVadEnable()intgetMaxSpeechTimeS()floatgetMinSpeechLength()最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值intgetNbest()intgetNoSpeechTimeOut()OneshotCache<byte[]>getOneshotCache()java.lang.String[]getOneshotOptimizationFilterWords()java.lang.StringgetOrganization()intgetPauseTime()org.json.JSONArraygetPhraseHintsJsonArray()java.lang.StringgetProductId()java.lang.StringgetResourceType()java.lang.StringgetSaveAudioPath()intgetSelfCustomWakeupScore()java.lang.StringgetServer()java.lang.StringgetServerName()java.lang.StringgetUserId()java.util.List<java.lang.String>getUsers()intgetWaitingTimeout()java.lang.StringgetWakeupWord()java.lang.StringgetWssDMCustomParams()booleanisCloudVadEnable()booleanisCloudVprintVadEnable()booleanisEnableAlignment()booleanisEnableAudioDetection()booleanisEnableConfidence()booleanisEnableDialectProcess()booleanisEnableDialectProcessNlurec()booleanisEnableEmotion()booleanisEnableFirstDec()booleanisEnableFirstDecForce()booleanisEnableLanguageClassifier()booleanisEnableNumberConvert()booleanisEnablePunctuation()booleanisEnableRecUppercase()booleanisEnableSensitiveWdsNorm()booleanisEnableSNTime()booleanisEnableTone()booleanisEncodedAudio()booleanisIgnoreEmptyResult()booleanisOneshotOptimization()booleanisRealback()booleanisSaveOriginalAudio()booleanisUseCustomFeed()booleanisUseDmAsr()booleanisUseOneShot()booleanisUseStrongWakeupVisible()booleanisWakeupWordFilter()voidputExtraParam(java.lang.String key, java.lang.Object value)设置额外的参数,以 key:value 的形式发送给服务器。voidsetAudioType(AICloudASRIntent.PCM_ENCODE_TYPE audioType)设置 PCM 编码成其它格式,以减小传输大小。voidsetCloudVadEnable(boolean cloudVadEnable)设置是否开启服务端的vad功能,一般近场关闭,远场打开voidsetCloudVprintVadEnable(boolean cloudVprintVadEnable)voidsetCommonWakeupWord(org.json.JSONArray commonWakeupWord)配置自定义唤醒词;等价customWakeupWordvoidsetConstantContent(java.lang.String constantContent)标记语音中已知的固定的文本内容(如唤醒词),算法会特殊处理被标记的音频。voidsetContextId(java.lang.String contextId)如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须voidsetCustomWakeupScore(int customWakeupScore)voidsetCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord)设置自定义唤醒词,可用于过滤和指定唤醒词识别比如 ["你好小乐","你好小白"]voidsetCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord, boolean filter)设置自定义唤醒词和 是否过滤句首唤醒词,用于 oneshot 功能。voidsetDeviceId(java.lang.String deviceId)已过时。不再使用voidsetDomain(java.lang.String domain)领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置voidsetEnableAlignment(boolean enableAlignment)voidsetEnableAudioDetection(boolean enableAudioDetection)voidsetEnableConfidence(boolean enableConfidence)设置置信度voidsetEnableDialectProcess(boolean enableDialectProcess)voidsetEnableDialectProcessNlurec(boolean enableDialectProcessNlurec)voidsetEnableEmotion(boolean enableEmotion)是否开启情感识别voidsetEnableFirstDec(boolean enableFirstDec)首字延时优化voidsetEnableFirstDecForce(boolean enableFirstDecForce)vad=false时强制开首字优化voidsetEnableLanguageClassifier(boolean enableLanguageClassifier)已过时。无效参数,废弃voidsetEnableNumberConvert(boolean enableNumberConvert)设置是否启用识别结果汉字数字转阿拉伯数字功能voidsetEnablePunctuation(boolean enablePunctuation)设置是否启用标点符号识别voidsetEnableRecUppercase(boolean enableRecUppercase)输出英文字母转成大写,true 为转大写,false 为不转大写。voidsetEnableSensitiveWdsNorm(boolean enableSensitiveWdsNorm)敏感词过滤 true 是开启,false 是关闭 默认是开启voidsetEnableSNTime(boolean enableSNTime)设置rec结果增加对齐信息,默认为false,关闭voidsetEnableTone(boolean enableTone)设置音调功能,默认为false,关闭voidsetExtraParam(java.util.Map<java.lang.String,java.lang.Object> extraParam)设置额外的参数voidsetFespxEngine(IFespxEngine fespxEngine)设置关联 IFespxEngine 实例,只在使用内部录音机且多麦模式下才需要设置voidsetGroupId(java.lang.String groupId)voidsetHotWords(java.lang.String[] hotWords)设置产品级热词,比如"你好小驰"设置之后,识别的同音词都会被识别为 你好小驰 ["你好小驰","思必驰"]voidsetIgnoreEmptyResult(boolean ignoreEmptyResult)设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别voidsetIgnoreEmptyResult(boolean ignoreEmptyResult, int ignoreEmptyResultCounts)设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别voidsetLanguage(java.lang.String language)指定语种,默认中文("zh-cn")。voidsetLmId(java.lang.String lmId)设置识别lmidvoidsetLmList(java.lang.String[] lmList)设置用户定制的语言模型列表voidsetLocalVadEnable(java.lang.Boolean localVadEnable)设置是否启用本地vad。voidsetMaxSpeechTimeS(int seconds)设置音频最大录音时长,达到该值将取消语音引擎并抛出异常
允许的最大录音时长 单位秒 0 表示无最大录音时长限制 默认大小为60SvoidsetMinSpeechLength(float minSpeechLength)最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值voidsetNbest(int nbest)设置 nbestvoidsetNoSpeechTimeOut(int milliSecond)设置无语音超时时长,单位毫秒,默认值为5000ms ;如果达到该设置值时,自动停止录音 设置为0表示不进行语音超时判断voidsetOneshotCache(OneshotCache<byte[]> oneshotCache)voidsetOneshotOptimization(boolean oneshotOptimization)初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别voidsetOneshotOptimization(boolean oneshotOptimization, java.lang.String[] oneshotOptimizationFilterWords)初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别。voidsetPauseTime(int pauseTime)设置VAD右边界voidsetPhraseHints(PhraseHints[] phraseHints)设置请求级热词,一般和用户的训练集一起搭配使用。voidsetProductId(java.lang.String productId)已过时。不再使用voidsetRealback(boolean realback)设置是否使用实时反馈功能voidsetResourceType(java.lang.String type)设置识别引擎的资源类型,默认为comm 通用:comm 车载:aicar 机器人:airobot 家居:aihome 英文:aienglish 中英混:aienglish-mix 电视:aitvvoidsetSaveAudioPath(java.lang.String saveAudioPath)设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"voidsetSaveAudioPath(java.lang.String saveAudioPath, boolean saveOriginalAudio)设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"voidsetSelfCustomWakeupScore(int selfCustomWakeupScore)自定义唤醒词自定义分数设置,因该参数会影响识别唤醒词的效果同时会增加误识别风险, 建议在专业人士指导下定制自定义分数(建议给-5), 该项可以配合 wakeupWord/customWakeupWord 使用voidsetServer(java.lang.String server)设置服务器地址,默认不用设置voidsetUseCustomFeed(boolean useCustomFeed)设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord)voidsetUseCustomFeed(boolean useCustomFeed, boolean encodedAudio)设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord) feed 的音频如果不是pcm音频,则不能使用 vad 功能voidsetUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson)voidsetUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson, java.lang.String dmWssCustomparams)是否是对话用的ASR,用于对话使用,使用单独的请求参数voidsetUseOneShot(boolean useOneShot)是否使用oneshot功能,default is false
true 使用one shot功能,唤醒后立马起识别
false 不使用oneshot,合成后启动识别,或只是启动识别voidsetUseOneShot(boolean useOneShot, int intervalTimeThresh)设置是否使用oneshot功能,以及oneshot功能的唤醒词和命令词之间的时间间隔阈值, 如果小于该阈值,就认为不是oneshot,如果大于该阈值,就认为是oneshotvoidsetUserId(java.lang.String userId)设置用户标示voidsetUseStrongWakeupVisible(boolean useStrongWakeupVisible)default is 使用场景:开启oneShot功能,开启实时返回,识别结果会有唤醒词或者是唤醒词前面有其他杂音情况。voidsetVprintInfo(java.lang.String serverName, java.util.List<java.lang.String> users, java.lang.String organization)设置要验证的声纹信息voidsetWaitingTimeout(int waitingTimeout)设置等待识别结果超时时间 单位毫秒,小于或等于0则不设置超时,默认5000ms.voidsetWakeupWord(java.lang.String wakeupWord)配置自定义唤醒词功能;配合唤醒词分数使用可增强唤醒词识别,同时结果中过滤所传唤醒词; 如果同时设置commonWakeupWord,仍会过滤唤醒词,但唤醒词的增强识别会生效java.lang.StringtoString()
-
-
-
方法详细资料
-
getOneshotCache
public OneshotCache<byte[]> getOneshotCache()
-
getDeviceId
public java.lang.String getDeviceId()
-
getProductId
public java.lang.String getProductId()
-
setOneshotCache
public void setOneshotCache(OneshotCache<byte[]> oneshotCache)
-
setDeviceId
@Deprecated public void setDeviceId(java.lang.String deviceId)
已过时。不再使用设置deviceId,需要和授权时设置的一样,建议不做外部传参,由SDK内部统一规划,不再做版本向前兼容- 参数:
deviceId-
-
setProductId
@Deprecated public void setProductId(java.lang.String productId)
已过时。不再使用设置productId,需要和授权时设置的一样,建议不做外部传参,由SDK内部统一规划,不再做版本向前兼容- 参数:
productId-
-
isEnableRecUppercase
public boolean isEnableRecUppercase()
-
setEnableRecUppercase
public void setEnableRecUppercase(boolean enableRecUppercase)
输出英文字母转成大写,true 为转大写,false 为不转大写。默认 true- 参数:
enableRecUppercase- true/false
-
isEnableSensitiveWdsNorm
public boolean isEnableSensitiveWdsNorm()
-
setEnableSensitiveWdsNorm
public void setEnableSensitiveWdsNorm(boolean enableSensitiveWdsNorm)
敏感词过滤 true 是开启,false 是关闭 默认是开启- 参数:
enableSensitiveWdsNorm-
-
getCustomWakeupScore
public int getCustomWakeupScore()
-
setCustomWakeupScore
public void setCustomWakeupScore(int customWakeupScore)
-
isEnableEmotion
public boolean isEnableEmotion()
-
isEnableFirstDec
public boolean isEnableFirstDec()
-
setEnableFirstDec
public void setEnableFirstDec(boolean enableFirstDec)
首字延时优化- 参数:
enableFirstDec- 默认是false
-
isEnableFirstDecForce
public boolean isEnableFirstDecForce()
-
setEnableFirstDecForce
public void setEnableFirstDecForce(boolean enableFirstDecForce)
vad=false时强制开首字优化- 参数:
enableFirstDecForce- 默认是false
-
setEnableEmotion
public void setEnableEmotion(boolean enableEmotion)
是否开启情感识别- 参数:
enableEmotion- true 开启,false 不开(default)
-
isUseStrongWakeupVisible
public boolean isUseStrongWakeupVisible()
-
setUseStrongWakeupVisible
public void setUseStrongWakeupVisible(boolean useStrongWakeupVisible)
default is 使用场景:开启oneShot功能,开启实时返回,识别结果会有唤醒词或者是唤醒词前面有其他杂音情况。 目前出现此类问题是sspe送回来的音频回滚时间较长 或者三方送入的音频唤醒词前音频较长,导致唤醒词前面数据也会带入 开启此功能,云端进行过滤,xxx(唤醒词) 0. 不包含xxx => “” 1. xxx => “” 2. 123xxx => “” 3. xxx456 => “456” 4. 123xxx456 => “456” 新增输出接口"strong_wakeup_filtered",在eof=1时输出,具体如下: var部分: (1) var正常进行唤醒词过滤,若第一个rec片段对应的var匹配到唤醒词,过滤唤醒词及之前的内容,且后续的rec片段对应的var不需要再过滤; (2) 如果第一个rec片段对应的var配有匹配到唤醒词,则后续的rec片段对应的var继续匹配和过滤; rec部分: (1) 限制仅在第一个rec片段实现唤醒词匹配过滤,若匹配到唤醒词,则在eof=1的rec片段输出中,加入"strong_wakeup_filtered"=1的标记,若没有匹配到,则标记为0; (2) 第一个rec和nlu_rec如果匹配到唤醒词,则正常过滤,没有匹配到,则输出原文本,其他rec和nlu_rec的内容不受过滤影响,可以正常输出; Note: 这个功能与唤醒词后置功能互斥 ,需要与setWakeupWord 一起使用- 参数:
useStrongWakeupVisible- true,开启特殊唤醒词过滤功能,强制过滤唤醒词及之前内容; false 关闭特殊唤醒词过滤
-
isEnableDialectProcess
public boolean isEnableDialectProcess()
-
setEnableDialectProcess
public void setEnableDialectProcess(boolean enableDialectProcess)
-
isEnableDialectProcessNlurec
public boolean isEnableDialectProcessNlurec()
-
setEnableDialectProcessNlurec
public void setEnableDialectProcessNlurec(boolean enableDialectProcessNlurec)
-
getPhraseHintsJsonArray
public org.json.JSONArray getPhraseHintsJsonArray()
-
isUseDmAsr
public boolean isUseDmAsr()
-
setUseDmAsr
public void setUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson)
-
getWakeupWord
public java.lang.String getWakeupWord()
-
setWakeupWord
public void setWakeupWord(java.lang.String wakeupWord)
配置自定义唤醒词功能;配合唤醒词分数使用可增强唤醒词识别,同时结果中过滤所传唤醒词; 如果同时设置commonWakeupWord,仍会过滤唤醒词,但唤醒词的增强识别会生效- 参数:
wakeupWord-
-
getCommonWakeupWord
public org.json.JSONArray getCommonWakeupWord()
-
setCommonWakeupWord
public void setCommonWakeupWord(org.json.JSONArray commonWakeupWord)
配置自定义唤醒词;等价customWakeupWord- 参数:
commonWakeupWord-
-
setUseDmAsr
public void setUseDmAsr(boolean useDmAsr, org.json.JSONObject dmAsrJson, java.lang.String dmWssCustomparams)是否是对话用的ASR,用于对话使用,使用单独的请求参数- 参数:
dmAsrJson- dmAsrjsonuseDmAsr- use dm asrdmWssCustomparams- 是否使用鉴权参数
-
getWssDMCustomParams
public java.lang.String getWssDMCustomParams()
-
getDmAsrJson
public org.json.JSONObject getDmAsrJson()
-
setPhraseHints
public void setPhraseHints(PhraseHints[] phraseHints)
设置请求级热词,一般和用户的训练集一起搭配使用。如果已经关联了对应的模型,则不需要设置模型IDsetLmId(String)setLmList(String[])aiCloudASRIntent.setPhraseHints(new PhraseHints[]{new PhraseHints("city", new String[]{"海上明月生"})});- 参数:
phraseHints- 请求级热词列表
-
getFespxEngine
public IFespxEngine getFespxEngine()
-
setFespxEngine
public void setFespxEngine(IFespxEngine fespxEngine)
设置关联 IFespxEngine 实例,只在使用内部录音机且多麦模式下才需要设置- 参数:
fespxEngine- 引擎实例- 抛出:
java.lang.RuntimeException- 内部录音机且多麦模式下没设置
-
getHotWords
public java.lang.String[] getHotWords()
-
setHotWords
public void setHotWords(java.lang.String[] hotWords)
设置产品级热词,比如"你好小驰"设置之后,识别的同音词都会被识别为 你好小驰 ["你好小驰","思必驰"]- 参数:
hotWords- 产品级热词列表
-
setSaveAudioPath
public void setSaveAudioPath(java.lang.String saveAudioPath, boolean saveOriginalAudio)设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"- 参数:
saveAudioPath- 文件路径saveOriginalAudio- 是否保存从start到stop所有的音频,default is false
-
setUseOneShot
public void setUseOneShot(boolean useOneShot, int intervalTimeThresh)设置是否使用oneshot功能,以及oneshot功能的唤醒词和命令词之间的时间间隔阈值, 如果小于该阈值,就认为不是oneshot,如果大于该阈值,就认为是oneshot- 参数:
useOneShot- true 使用 oneshot功能,false 不使用intervalTimeThresh- useOneShot 为 true 时才有效,单位:毫秒,默认为600ms。
-
getNoSpeechTimeOut
public int getNoSpeechTimeOut()
-
setNoSpeechTimeOut
public void setNoSpeechTimeOut(int milliSecond)
设置无语音超时时长,单位毫秒,默认值为5000ms ;如果达到该设置值时,自动停止录音 设置为0表示不进行语音超时判断- 参数:
milliSecond- 超时时长,单位毫秒- 另请参阅:
SpeechParams.setNoSpeechTimeout(int)
-
getMaxSpeechTimeS
public int getMaxSpeechTimeS()
-
setMaxSpeechTimeS
public void setMaxSpeechTimeS(int seconds)
设置音频最大录音时长,达到该值将取消语音引擎并抛出异常
允许的最大录音时长 单位秒- 0 表示无最大录音时长限制
- 默认大小为60S
- 参数:
seconds- seconds- 另请参阅:
SpeechParams.setMaxSpeechTimeS(int)
-
getSaveAudioPath
public java.lang.String getSaveAudioPath()
-
setSaveAudioPath
public void setSaveAudioPath(java.lang.String saveAudioPath)
设置保存的音频路径,最终的音频路径为path + recordId + ".ogg"- 参数:
saveAudioPath- 文件路径
-
isSaveOriginalAudio
public boolean isSaveOriginalAudio()
-
getWaitingTimeout
public int getWaitingTimeout()
-
setWaitingTimeout
public void setWaitingTimeout(int waitingTimeout)
设置等待识别结果超时时间 单位毫秒,小于或等于0则不设置超时,默认5000ms. 从vad结束或者用户主动调用stop方法开始计时- 参数:
waitingTimeout- 超时时长
-
getIntervalTimeThresh
public int getIntervalTimeThresh()
-
isUseOneShot
public boolean isUseOneShot()
-
setUseOneShot
public void setUseOneShot(boolean useOneShot)
是否使用oneshot功能,default is false
true 使用one shot功能,唤醒后立马起识别
false 不使用oneshot,合成后启动识别,或只是启动识别- 参数:
useOneShot- true 使用 oneshot功能,false 不使用
-
getPauseTime
public int getPauseTime()
-
setPauseTime
public void setPauseTime(int pauseTime)
设置VAD右边界- 参数:
pauseTime- pauseTime 单位为ms,默认为300ms
-
getLmList
public java.lang.String[] getLmList()
-
setLmList
public void setLmList(java.lang.String[] lmList)
设置用户定制的语言模型列表- 参数:
lmList- 语言模型列表
-
setCustomWakeupWord
public void setCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord, boolean filter)设置自定义唤醒词和 是否过滤句首唤醒词,用于 oneshot 功能。 比如音频输入为"你好小驰,今天天气怎么样",filter 为 true 后识别结果即为"今天天气怎么样"- 参数:
customWakeupWord- 自定义唤醒词 ["你好小弛"]filter- false (default)不过滤, true 过滤
-
getLanguage
public java.lang.String getLanguage()
-
setLanguage
public void setLanguage(java.lang.String language)
指定语种,默认中文("zh-cn")。需要 res 支持语种- 参数:
language- 语种
-
setUseCustomFeed
public void setUseCustomFeed(boolean useCustomFeed, boolean encodedAudio)设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord) feed 的音频如果不是pcm音频,则不能使用 vad 功能- 参数:
useCustomFeed- 设置是否自行feed数据,默认falseencodedAudio- feed的音频是否是编码成 MP3 OGG OPUS OGG_OPUS 等音频的
-
isEncodedAudio
public boolean isEncodedAudio()
-
getServer
public java.lang.String getServer()
-
setServer
public void setServer(java.lang.String server)
设置服务器地址,默认不用设置- 参数:
server- 服务器地址,包含ws://
-
getUserId
public java.lang.String getUserId()
-
setUserId
public void setUserId(java.lang.String userId)
设置用户标示- 参数:
userId- 用户标示
-
getLmId
public java.lang.String getLmId()
-
setLmId
public void setLmId(java.lang.String lmId)
设置识别lmid- 参数:
lmId- custom lmid
-
isEnablePunctuation
public boolean isEnablePunctuation()
-
setEnablePunctuation
public void setEnablePunctuation(boolean enablePunctuation)
设置是否启用标点符号识别- 参数:
enablePunctuation- 默认为false
-
isEnableNumberConvert
public boolean isEnableNumberConvert()
-
setEnableNumberConvert
public void setEnableNumberConvert(boolean enableNumberConvert)
设置是否启用识别结果汉字数字转阿拉伯数字功能- 参数:
enableNumberConvert- 默认为false
-
getSelfCustomWakeupScore
public int getSelfCustomWakeupScore()
-
setSelfCustomWakeupScore
public void setSelfCustomWakeupScore(int selfCustomWakeupScore)
自定义唤醒词自定义分数设置,因该参数会影响识别唤醒词的效果同时会增加误识别风险, 建议在专业人士指导下定制自定义分数(建议给-5), 该项可以配合 wakeupWord/customWakeupWord 使用- 参数:
selfCustomWakeupScore- 自定义唤醒词得分
-
getCustomWakeupWord
public org.json.JSONArray getCustomWakeupWord()
-
setCustomWakeupWord
public void setCustomWakeupWord(java.util.List<java.lang.String> customWakeupWord)
设置自定义唤醒词,可用于过滤和指定唤醒词识别比如 ["你好小乐","你好小白"]- 参数:
customWakeupWord- customWakeupWord
-
isWakeupWordFilter
public boolean isWakeupWordFilter()
-
isEnableTone
public boolean isEnableTone()
-
setEnableTone
public void setEnableTone(boolean enableTone)
设置音调功能,默认为false,关闭- 参数:
enableTone- enableTone
-
isEnableLanguageClassifier
public boolean isEnableLanguageClassifier()
-
setEnableLanguageClassifier
@Deprecated public void setEnableLanguageClassifier(boolean enableLanguageClassifier)
已过时。无效参数,废弃设置语言分类功能,默认为false,关闭- 参数:
enableLanguageClassifier- enableLanguageClassifier
-
isEnableSNTime
public boolean isEnableSNTime()
-
setEnableSNTime
public void setEnableSNTime(boolean enableSNTime)
设置rec结果增加对齐信息,默认为false,关闭- 参数:
enableSNTime- enableSNTime
-
getResourceType
public java.lang.String getResourceType()
-
setResourceType
public void setResourceType(java.lang.String type)
设置识别引擎的资源类型,默认为comm 通用:comm 车载:aicar 机器人:airobot 家居:aihome 英文:aienglish 中英混:aienglish-mix 电视:aitv- 参数:
type- 资源类型
-
isRealback
public boolean isRealback()
-
setRealback
public void setRealback(boolean realback)
设置是否使用实时反馈功能- 参数:
realback- realback 默认为false
-
isCloudVadEnable
public boolean isCloudVadEnable()
-
setCloudVadEnable
public void setCloudVadEnable(boolean cloudVadEnable)
设置是否开启服务端的vad功能,一般近场关闭,远场打开- 参数:
cloudVadEnable- cloudVadEnable 默认为true
-
isUseCustomFeed
public boolean isUseCustomFeed()
-
setUseCustomFeed
public void setUseCustomFeed(boolean useCustomFeed)
设置是否自行feed数据,不使用内部录音机(包括MockRecord和AIAudioRecord)- 参数:
useCustomFeed- the useCustomFeed to set
-
getNbest
public int getNbest()
-
setNbest
public void setNbest(int nbest)
设置 nbest- 参数:
nbest- nbest,默认为0
-
setEnableAlignment
public void setEnableAlignment(boolean enableAlignment)
-
setEnableAudioDetection
public void setEnableAudioDetection(boolean enableAudioDetection)
-
isEnableAlignment
public boolean isEnableAlignment()
-
isEnableAudioDetection
public boolean isEnableAudioDetection()
-
isOneshotOptimization
public boolean isOneshotOptimization()
-
setOneshotOptimization
public void setOneshotOptimization(boolean oneshotOptimization)
初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别- 参数:
oneshotOptimization- true 优化,false 不优化(default)
-
setOneshotOptimization
public void setOneshotOptimization(boolean oneshotOptimization, java.lang.String[] oneshotOptimizationFilterWords)初始化前设置有效,oneshot 功能优化,当用户说 唤醒词+命令词 时,vad在唤醒词后即结束,导致asr识别结果是空, 可打开此功能,此功能会保留唤醒词后vad结束后的音频,即命令词的音频,然后重新asr识别。- 参数:
oneshotOptimization- true 优化,false 不优化(default)oneshotOptimizationFilterWords- oneshot优化功能打开后,第一轮识别时可以过滤一些无意义的词,比如:呃,嗯
-
getOneshotOptimizationFilterWords
public java.lang.String[] getOneshotOptimizationFilterWords()
-
getAudioType
public AICloudASRIntent.PCM_ENCODE_TYPE getAudioType()
-
setAudioType
public void setAudioType(AICloudASRIntent.PCM_ENCODE_TYPE audioType)
设置 PCM 编码成其它格式,以减小传输大小。 云端识别需要将PCM音频编译成其它音频格式发送给服务器。- 参数:
audioType- PCM 编码成其它格式
-
getExtraParam
public java.util.Map<java.lang.String,java.lang.Object> getExtraParam()
-
setExtraParam
public void setExtraParam(java.util.Map<java.lang.String,java.lang.Object> extraParam)
设置额外的参数- 参数:
extraParam- 额外的参数
-
putExtraParam
public void putExtraParam(java.lang.String key, java.lang.Object value)设置额外的参数,以 key:value 的形式发送给服务器。 例如:["abc":"ABC","num":123,"bb":false,"list":["a","1","c"]]- 参数:
key- key,例如:"abc" "num" "list"value- value,例如:"ABC" 123 false ["a","1","c"]
-
isEnableConfidence
public boolean isEnableConfidence()
-
setEnableConfidence
public void setEnableConfidence(boolean enableConfidence)
设置置信度- 参数:
enableConfidence- 置信度,默认为true
-
getLocalVadEnable
public java.lang.Boolean getLocalVadEnable()
-
setLocalVadEnable
public void setLocalVadEnable(java.lang.Boolean localVadEnable)
设置是否启用本地vad。启用前提是AICloudASRConfig.isLocalVadEnable()为true,否则该参数无效。 此参数可设置本轮start的引擎是否使用vad功能- 参数:
localVadEnable- null 使用和AICloudASRConfig.isLocalVadEnable()一样的设置, true 使用Vad, false 禁止Vad
-
isIgnoreEmptyResult
public boolean isIgnoreEmptyResult()
-
setIgnoreEmptyResult
public void setIgnoreEmptyResult(boolean ignoreEmptyResult)
设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别- 参数:
ignoreEmptyResult- 是否忽略空结果,默认为false
-
getIgnoreEmptyResultCounts
public int getIgnoreEmptyResultCounts()
-
setIgnoreEmptyResult
public void setIgnoreEmptyResult(boolean ignoreEmptyResult, int ignoreEmptyResultCounts)设置忽略无结果的返回值,如果设置为true,则遇到返回值为空则会自动重启引擎,直接进入下一轮识别- 参数:
ignoreEmptyResult- 是否忽略空结果,默认为falseignoreEmptyResultCounts- 忽略空结果的重试次数,默认为3
-
toString
public java.lang.String toString()
- 覆盖:
toString在类中java.lang.Object
-
getConstantContent
public java.lang.String getConstantContent()
-
setConstantContent
public void setConstantContent(java.lang.String constantContent)
标记语音中已知的固定的文本内容(如唤醒词),算法会特殊处理被标记的音频。在dp-sr、sti-sr 算法中,会触发使用定制的文本相关模型,替代通用的文本无关模型,提升声纹的识别率。- 参数:
constantContent- 固定的文本内容
-
setVprintInfo
public void setVprintInfo(java.lang.String serverName, java.util.List<java.lang.String> users, java.lang.String organization)设置要验证的声纹信息- 参数:
serverName- 声纹的服务名 vpr和sdrusers- 要验证的 userId 列表,userId 即注册声纹时的 userIdorganization- 用户所在的公司,项目
-
getGroupId
public java.lang.String getGroupId()
-
setGroupId
public void setGroupId(java.lang.String groupId)
-
getServerName
public java.lang.String getServerName()
-
getOrganization
public java.lang.String getOrganization()
-
getUsers
public java.util.List<java.lang.String> getUsers()
-
isCloudVprintVadEnable
public boolean isCloudVprintVadEnable()
-
setCloudVprintVadEnable
public void setCloudVprintVadEnable(boolean cloudVprintVadEnable)
-
getDomain
public java.lang.String getDomain()
领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置- 返回:
- 返回当前domain
-
setDomain
public void setDomain(java.lang.String domain)
领域(comm/aihome/aitv/aicar/aiphone/airobot/aitranson-cn-16k/aitranson-en-16k),用于asrplus,和res对应,可不设置- 参数:
domain- 设置domain
-
getContextId
public java.lang.String getContextId()
如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须- 返回:
- 返回当前contextID,判断是否是同一个验证
-
setContextId
public void setContextId(java.lang.String contextId)
如果有contextId,服务端认为是同一个验证,会使用保存的cache和新的数据进行加强验证,非必须- 参数:
contextId- 用于校验是否是同一个验证
-
getMinSpeechLength
public float getMinSpeechLength()
最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值- 返回:
- 返回最小有效音频长度
-
setMinSpeechLength
public void setMinSpeechLength(float minSpeechLength)
最小有效音频长度,单位秒,当前服务配置: sti-sr 1s lti-sr 500ms sdk默认1s,不要使用小于服务器配置的值- 参数:
minSpeechLength- 设置最小有效音频长度
-
-