思必驰算法及模型备案公示说明

思必驰算法及模型备案公示说明

 

思必驰科技股份有限公司及其关联公司(以下简称“我们”或“思必驰”)是国内专业的大模型对话式人工智能平台型企业,基于自研的全链路智能对话系统定制开发平台、语言计算大模型、人工智能语音芯片,围绕“端云一体化”布局,为物联网领域提供软硬件结合的人工智能技术与产品服务。请您仔细阅读以下内容,同时也为了保障您在使用过程中的个人信息权益及隐私安全、为规范您的输入行为,以及明确我们的免责声明,我们特别制定了本算法及模型备案公示说明,让您更加了解并顺畅地使用该服务。

 

一、算法

 

思必驰已备案算法如下:

算法名称:DFM-2东风大模型

备案编号:网信算备320506772010401230019号

算法基本原理:DFM-2 东风大模型的核心是使用 Transformer 架构,它是一种基于自注意力机制(self-attention)的神经网络,可以很好地处理序列型数据。通过 DFM-2 东风大模型将每一个单词编码成向量表示,再将这些向量序列输入到神经网络中进行训练。在训练过程中,网络不断优化自己的参数,以逐渐提高对语言的理解和生成能力。

算法运行机制:DFM-2 东风大模型将用户的输入编码成为高维空间中的向量,通过大量的矩阵运算得到生成每一个词的概率,取每个位置概率最大的词组成句子输出作为用户的回复。

算法目的意图:算法开发的目的是满足各个业务线中对文本生成、智能助手和语义理解等方面的需求,同时能够提升人机交互的体验。此外,将大量繁琐、流水式的工作交给大模型,能够达到降本增效的效果。

 

算法名称:思必驰语音识别算法

备案编号:网信算备320506772010401240021号

算法基本原理:思必驰语音识别算法由声学模型、语言模型两部分组成:声学模型采用自研VDCNN-CTC技术,以字为建模单元,兼具高准确率与快速解码能力;语言模型采用两级Ngram+神经网络重打分,并引入“多路解码融合”支持场景化定制。

算法运行机制:思必驰语音识别算法将用户输入的语音编码成高维度的特征向量,通过大量的矩阵运算和非线性变换,生成每个字的概率分布,再结合统计语言中每个词出现的概率,得到对应输入语音最可能的文本内容。

算法目的意图:算法开发的目的是为了满足各业务线对语音转文字的需求,同时作为人机对话系统的基础,提升人机交互的体验。

 

 

 

算法名称:思必驰翻译算法

备案编号:网信算备320506772010401240039号

算法基本原理:思必驰方言翻译算法通过四大模块协同滚动更新,确保翻译结果“语义不变、实体保留、句式简化、可升级”,自研低资源编码-解码框架+数据增强与蒸馏,参数量压缩90%,效果几乎无损;高频控制类语句秒级规则映射,兼顾解析友好,速度提升数十倍;线上热词分钟级注入,即时修正错译;百万级实体词库使得地址、歌曲、影视、人名等精准保留。

算法运行机制:采用使用一个模型解决多个外语语种和方言的翻译方案,并且搭配完善的定制化流程。翻译模型将用户输入编码成高维空间的向量,通过大量线性和非线性叠加运算,得到生成词的概率,取每个位置概率最大的词组成的句子,作为翻译的输出结果。

算法目的意图:算法的目的是满足各个业务线对翻译的需求,提升人机交互体验。此外,通过对现有中文对话系统的快速迁移,达到降本增效的目的。

 

 

算法名称:思必驰语音合成算法

备案编号:网信算备320506772010401240047号

算法基本原理:思必驰TTS由文本前端、VQTTS声学模型、GAN声码器一体构成:前端用混合算法完成文本规范、分词词性、多音字及韵律预测;声学模型以离散潜在变量+Vector Quantization配自注意力生成频谱,兼顾表达与长程依赖;GAN声码器量化推理、流式输出,擅建模非平稳语音,抗过拟合,低资源也能高质合成。

算法运行机制:思必驰语音合成算法将用户输入的文本提取高维特征向量,通过大量的矩阵运算和非线性变换,生成音频采样点。

算法目的意图:算法开发的目的是为了满足各业务线对文字转语音的需求,同时作为人机对话系统的基础,提升人机交互的体验。

 

算法名称:思必驰数字人生成算法

备案编号:网信算备320506772010401240055号

算法基本原理:思必驰数字人生成以HuBERT自监督提取情感声学特征,扩散模型把音频序列映射为面部特征序列,VAE自编码将特征压缩渲染成高真人脸,端到端深度优化实现高唇同步、高画质、快渲染等。

算法运行机制:将用户输入的语音编码成高阶的特征向量,通过大量的矩阵运算和非线性算法运行机制变换,映射为人脸面部特征向量,最后通过人脸面部特征向量渲染出高逼真的人脸画面。

算法目的意图:算法开发的目的是为了满足各业务线对数字人生成的需求,同时作为人机对话系统的基础,提升人机交互的体验。

 

算法名称:思必驰声音复刻算法

备案编号:网信算备320506772010401250067号

算法基本原理:思必驰声音复刻算法分为两个阶段,1)目标说话者提供参考音频数据,通过声纹建模技术捕捉目标声音的独特特征。从目标音频中提取关键特征,如音高、音调、声纹等,将其转换为声学特征表示。2)将输入文本通过训练好的声学模型转换为目标音色语音特征,利用声码器生成高质量的语音波形。

算法运行机制:思必驰声音复刻算法将用户输入的文本提取高维特征向量,通过从用户提供的参考音频中提取音色信息,并通过大量的矩阵运算和非线性变换,生成具有该用户音色信息的音频采样点。

算法目的意图:算法开发的目的是为了满足各业务线对文字转语音的需求,同时作为人机对话系统的基础,提升人机交互的体验。

 

算法名称:思必驰声音转换算法

备案编号:网信算备320506772010401250075号

算法基本原理:思必驰声音转换算法先以编码-解码降噪提纯录音,再用自监督编码器抽离散语音单元并提取目标音色,联合驱动转换模型实时生成目标韵律声学特征,最后由高保真神经声码器一次输出自然流畅、音色逼真的转换语音。

算法运行机制:思必驰声音转换算法将用户输入的语音信号编码成高维声音特征向量,利用大量矩阵运算和非线性转换机制映射为个性化语音特质,最终合成出高保真、自然真实的声音转换效果。

算法目的意图:算法开发的目的是为了满足各业务线对个性化语音交互的需求,提升人机交互的体验。

 

 

二、大模型

 

思必驰已备案大语言模型如下:

模型名称:东风(DFM)语言大模型

模型备案编号:Jiangsu-DongFeng-20231107

 

模型名称:一鸣智能客服大模型

模型备案编号:Jiangsu-YiMingZhiNengKeFu-202508130044

 

三、隐私数据处理

我们尊重并保护您及所有使用本服务用户的个人隐私、商业秘密。在此提醒您:请您确认使用本服务时输入的内容将不包含您或他人的个人信息、商业秘密等敏感内容。我们理解您输入的文本对话信息、提交的信息反馈中可能包含他人的个人信息,如包含,请您务必取得他人的合法授权,避免造成他人个人信息的不当泄露。如涉及利用用户的输入构造训练数据,我们会对数据进行安全加密技术处理、严格的去标识化和匿名化处理,尽可能使其无法关联到任何特定个人,且不会在模型给其他用户的输出中带有个人信息,更不会将其用于用户画像或个性化推荐。

 

四、算法与模型的局限性和风险

人工智能可以为社会带来当前和潜在的好处,但是,由于技术限制或伦理问题,我们也十分关注模型被滥用的可能。如您选择继续使用思必驰的相关算法和模型,您应充分知悉并同意以下:

 

1. 鉴于机器学习和人工智能的性质,我们难以保证模型生成内容的真实性、准确性、可靠性,算法/模型可能会提供不正确、虚假的输出。输出仅供一般信息和参考之用,不构成您应该依赖的信息或建议,也不应成为您采取或避免采取任何行动的依据。您应该根据您的需求评估任何输出的准确性。在根据输出采取或避免采取任何行动之前,应当严肃考虑进一步咨询专业人士的建议。

 

2. 我们非常重视模型的内容安全问题,将努力采取合理的安全措施来过滤模型产出的不当/有害内容,保障其输出结果尽量符合规范预期,但无法完全排除仍有失误出现的情况。如果您遇到此种情况,请及时与我们反馈,我们将及时处理虚假、危险、偏见信息,以进一步优化模型。

 

3. 您应对您输入的内容负责,应确保您输入的内容未侵害他人权利,且请勿输入涉嫌违法、不良的内容。

 

4. 您不得利用我们提供的算法及人工智能相关服务制作、发布、传播虚假信息。您在发布或传播人工智能生成合成内容时,应当根据国家相关法律法规的规定予以标识或提示。您不得恶意删除、篡改、伪造、隐匿我们的生成合成内容标识,不得为他人实施上述恶意行为提供工具或者服务,不得通过不正当标识手段损害他人合法权益。

 

五、联系我们

如果您对我们提供的算法及人工智能相关服务有任何疑问或建议,或需要进行投诉、举报,,请通过以下联系方式与我们联系:

工单:思必驰DUI开放平台-【技术支持】-【提交工单】

联系电话:0512-62997990

联系邮箱:marketing@aispeech.com

联系地址:中国(江苏)自由贸易试验区苏州片区苏州工业园区新平街388号腾飞科技园14 幢