音频编辑系统和音频编辑方法
- 申请号:CN201010614165.X
- 专利类型:发明专利
- 申请(专利权)人:索尼公司;中国科学院声学研究所
- 公开(公开)号:CN102543080A
- 公开(公开)日:2012.07.04
- 法律状态:实质审查的生效
- 出售价格: 面议 立即咨询
专利详情
专利名称 | 音频编辑系统和音频编辑方法 | ||
申请号 | CN201010614165.X | 专利类型 | 发明专利 |
公开(公告)号 | CN102543080A | 公开(授权)日 | 2012.07.04 |
申请(专利权)人 | 索尼公司;中国科学院声学研究所 | 发明(设计)人 | 卢鲤;赵庆卫;颜永红;刘昆;吴伟国 |
主分类号 | G10L15/14(2006.01)I | IPC主分类号 | G10L15/14(2006.01)I;G10L15/02(2006.01)I;G10L15/06(2006.01)I |
专利有效期 | 音频编辑系统和音频编辑方法 至音频编辑系统和音频编辑方法 | 法律状态 | 实质审查的生效 |
说明书摘要 | 音频编辑系统包括:多个初始切分装置,分别将来自多个声道的音频流初始切分为多个不同的段落;多声道融合装置,对多个初始切分装置的切分点进行综合,并从每两个相邻的切分点之间选择最优的声道的音频流,从而得到多个初始切分片段,并且将得到的多个初始切分片段融合形成统一音频数据文件;音频聚类装置,基于层次聚类的算法,对多个初始切分片段进行有监督聚类,将属于同一性质的初始切分片段聚成一个类别;重新切分装置,利用音频聚类装置聚类的结果,训练得到每个类别相应的隐马尔科夫模型,并对统一音频文件进行维特比对齐切分,得到重新切分后的音频流。通过以上高精度的说话人切分系统,能够提高最终说话人聚类的准确性。 |
交易流程
-
01
选取所需
专利 -
02
确认专利
可交易 - 03 签订合同
- 04 上报材料
-
05
确认变更
成功 - 06 支付尾款
- 07 交付证书
过户资料
平台保障
1、源头对接,价格透明
2、平台验证,实名审核
3、合同监控,代办手续
4、专员跟进,交易保障
- 用户留言
暂时还没有用户留言