2018年7月,最高检印发了《全国检察机关智慧检务行动指南(2018-2020年)》,进一步完善智慧检务建设顶层设计工作,指明检察信息化工作发展方向。根据《行动指南》,到2020年底,检察机关将全面构建应用层、支撑层、数据层有机结合的新时代智慧检务生态,推进大数据、人工智能等前沿科技在刑事、民事、行政、公益诉讼等检察工作中的应用。《行动指南》确立了检察机关要遵循科学化、智能化、人性化三大原则推进智慧检务建设。明确了智慧检务建设目标是到2020年底,全面构建应用层、支撑层、数据层有机结合的新时代智慧检务生态,助力提升检察机关司法办案的法律效果、政治效果和社会效果。天津市宁河区人民检察院根据《行动指南》的要求,通过人工智能的技术手段逐步提升天津市宁河区人民检察院智慧检务的水平,计划通过智能语音识别技术,实现会议记录的智慧化。
二、技术参数
序号 |
采购项名称 |
技术参数 |
数量 |
单位 |
1 |
语音识别引擎服务器 |
CPU:2颗 英特尔 至强E5-2690 v4 2.6GHz GPU:2080Ti 内存:128GB 硬盘:SSD 1TB*2 硬盘:2TB SATA 网卡:集成2个千兆以太网接口 电源:冗余电源,冗余散热风扇 |
1 |
台 |
2 |
音频采集器 |
usb外置录音声卡 A-D动态范围:109 dB A加权(所有输入) D-A动态范围:108 dB A加权(线路输出) 时钟抖动:<250ps 支持采样率:44.1kHz, 48kHz, 88.2kHz,96kHz 麦克风输入 频率响应: 20Hz±0.5dB,20kHz±0.1dB(最小增益) THD+N:0.001% (1kHz,–1dBFS,20kHz BW) 噪声EIN:–122dBu CCIR-RMS(以增益为60dB与150ohm的终端测量) 较大输入电平:8 DBU(无垫) 线路输入 频率响应:20Hz-20kHz±0.1dB THD+N:0.007%(1kHz时,-1dBFS,20kHz BW) 噪音(NiPoS):–105dBFS CCIR-RMS(以分钟测量增益50ohm端接) 较大输入电平:>+28dBu 线路输出1和2 较大输出电平(0dBFS):+16dBu,平衡 THD+N:0.001%(1kHz时,-1dBFS,20kHz BW) |
2 |
台 |
3 |
麦克风 |
小型轻量,麦克风。 可将麦克风固定于领夹或置于桌上。 采用OFC导线,信号损失小,录音效果清晰。 型式:电容式。 指向特性:单一指向性 频率响应:100~18KHz。 信噪比:75dB SPL。 灵敏度:-30dB±3dB ODB=1V、PA.1kHz。 感度:-40±3.5db。 插头:3.5mm 镀金插头,配套转接6.5mm插头。 |
16 |
套 |
4 |
语音识别引擎 |
ASR 语音识别能力引擎可将音频(5 小时以内)数据转换成文本数据,为信息处理和数据挖掘提供基础。 清晰标准普通话音频的转写正确率达到 95%; 带口音普通话音频的转写正确率达到 85%; 远场音频的转写正确率达到 80%; 支持 mp3、wav、opus、ogg 等多种音频文件的导入转写。 音频转写的采样率为 8K\16K*16Bit。 单次上传音频个数最少支持 20 个 支持 16 路并发 支持长语音(1 分钟及以上)、短语音(1 秒至60秒)音频转写; 系统支持16路实时语音识别并发。 支持关键词优化 需支持人名、地名、专业词汇等的更新识别,上传至生效时间小于1小时。 模型定制化 针对本次项目做专门的语言模型及声学模型的优化,以提高系统识别准确率及合成正确率,同时覆盖各应用场景及通用场景 处理效率:1小时历史音频文件在 5 分钟内完成转写。 |
1 |
套 |
5 |
语音转写系统 |
权限管理: 系统维护权限与会议音频管理权限分离,系统管理员账号可以对普通用户账号进行赋权; 系统管理员账号不能监听、回听会议录音; 系统管理员账号不能有会议结果的读、写权限; 协同功能: 支持添加、移除、搜索协作人,将记录分享给其他用户应用内查看; 支持访问、编辑、管理协作人,记录协作人区分不同权限。 分享功能: 支持为了便于做文字处理,需支持将转写内容、纪要等内容导出为Word格式; 支持下载音频文件; 支持通过链接的方式分享音频、转写内容、纪要等内容。 支持用户选择分享内容,可选择的分享内容至少包括会议录音、识别结果和会议纪要。 安全水印: 支持对接天津市宁河区人民检察院原有的账号系统,根据账号信息及登录时间对网页稿增加安全水印。 富文本编辑工具: 支持考虑到后期处理的效率,系统WEB页面应支持富文本编辑工具,至少应包含文本编辑常用的操作: 撤销功能; 字体加粗、字号调节、删除线、文字下划线、斜体、字体颜色选择; 支持编号工具、标注工具; 支持文字对齐工具; 支持图片、表格插入和编辑。 导出文本格式:系统支持导出 docx格式文件 纪要功能: 支持在纪要模块创建待办事项并同步到待办中心; 支持基本信息、会议内容、待办事项,自定义模板,录音纪要快速生成; 支持编辑过程中,支持预览编辑结果。 定制化要求: 1、支持创建离线会议:根据天津市宁河区人民检察院会议室要求定制实现支持转写进度提示。离线转写将音频文件自动识别成中文文本。 2、支持根据天津市宁河区人民检察院检委会会议室要求定制实现导出文稿 将转写内容、纪要等内容导出为Word 导出音频 下载音频文件。 3、h5分享:支持通过链接的方式分享音频、转写内容、纪要等内容。 4、支持预览:语音转写的纪要可预览查看 6、支持多人协作: (1)根据天津市宁河区人民检察院检委会会议室要求定制实现协作人管理 添加、移除、搜索协作人。将记录分享给其他用户应用内查看。 (2)权限管理 访问、编辑、管理协作人,记录协作人区分不同权限。 7、个人管理 (1)支持根据天津市宁河区人民检察院会议室要求定制实现登录 支持统一认证方式登录方式 (2)登出:退出当前账号的登录 (3)个人信息维护:查看账号、姓名,设置头像等。 8、账号管理 (1)根据天津市宁河区人民检察院检委会会议室要求定制实现同步用户数据 同步单位内部基础用户数据,满足职工账号增删查改的需求。 (2)转写权限管理 分权限管控账号的转写权限,支持禁止转写、优先转写等调控。高用户权限等级任务支持插队。 9、安全水印:根据天津市宁河区人民检察院检委会会议室要求定制实现根据账号信息及登录时间对网页稿增加安全水印。 10、服务统计报表:根据天津市宁河区人民检察院检委会会议室要求定制实现对应用系统活跃情况多维度统计。 11、实现在天津市人民检察院检察机关人工智能与云安全平台开发的学习明法APP内开发智能会议助手模块。 界面功能展示: 1、会议语音识别:针对会议记录准确性和效率的部分,可视化展示重点标记、重点播放、会议暂停/续录功能。重点标记:在会议过程中,对重要的语音信息添加重点标记,通过文字备注标记的概要信息;重点播放:会议结束后,点击上一步重点标记的标记结果,可以播放标记的语音;会议暂停/续录:模拟会议休会后继续会议的场景,暂停会议记录,然后继续会议,最后形成的一份会议记录文件和一份会议录音文件。 2、会议结果分享:针对会后的信息分享需求,可视化展示下载原文、分享内容功能。下载原文:通过页面按键,一键导出原文;导出后的文稿的最终格式为docx格式;分享内容:分享内容选择时,至少应包含“录音”、“转写文本”、“会议纪要”和“笔记”; 3、会议纪要整理:针对会议纪要整理需求,可视化展示会议纪整理中需要的富文本编辑、纪要模板、待办事项。纪要模板:纪要模板至少应包含会议时间、会议地点、主持人、记录人、参会者、会议主题几个模块,编辑过程中可以进行预览;待办事项:支持增加新增待办,待办事项应包含责任人、截止时间和待办事项模块,编辑过程中可以进行预览;富文本编辑:上述功能均应具备常用的富文本编辑工具,至少应包含撤销、字体大小调节、字体加粗、斜体、下划线、删除线、字体颜色、编号、项目符号、对齐、插入图片、插入表格功能。 4、安全水印:针对会议信息安全保密需求,可视化展示页面安全水印、结果导出安全水印。页面安全水印:使用账号登录到会议系统中,WEB页面上会显示使用者的账号信息,防止有人恶意泄露敏感信息;结果导出安全水印:用户登录后导出原文,原文中会附带安全水印,水印内容至少包含用户的账号信息; 5、历史音频转写:针对历史会议语音识别需求,可视化展示上传队列、转写进度。上传队列:历史音频转写操作时要确保操作人员的工作效率,请演示离线转写同时上传多个文件的功能,展示识别上传进度、转写进度; 6、关键词优化:针对会议关键词优化的需求,可视化展示关键词更新过程。全局关键字优化:上传关键字,上传后对所有会议生效,会议中出现的关键字将会匹配到词表中的关键字上;会议关键词:上传关键字,上传后对本次会议生效,会议中出现的关键字将会匹配到词表中的关键 字上; |
1 |
套 |