在抖音【硬核狗聊ai】上刷到一条消息,说百度近期开通了千帆大模型平台,可以为资金不足的中小企业和个人(个人仅能使用文心一言,企业用户可以体验开源大模型如LLaMA),提供大模型按次收费的基础服务。所以注册实名认证了下。今天仅仅简单领取了各种优惠券并开通,因为他的平台还集成了语音识别,所以根据教程简单试用了一下,这里仅仅简单记录步骤方便个人回忆。
总的来说,识别效果与openai的whisper、讯飞语音识别、阿里的通义听悟相比,准确率上并没有优势,但云端测试转换速度最快。
目前语音识别在日常生活中应用,准确率已经很高了。但是专业词汇往往无法识别,比如”锂辉石“,以上提到的大模型均未准确识别。
我在想,是否因为传统行业受众少,收益低;同时大模型公司获取这些专业信息成本偏高,涉及知识产权问题,导致了其语料库中这部分内容的缺失?个人对模型进行微调训练,是否是一个好的研究和应用方向,需要花费多少时间成本呢?
官方说明-产品概述语音技术 (baidu.com)
个人体验操作
1 平台网址百度智能云-云智一体深入产业 (baidu.com)
2 语音识别位置,新手可以在里面领取免费资源
3 开通对象存储并上传语音文件,获取链接
4 根据教程复制链接,并获得请求ID,复制粘贴就可以了。