前不久,百度首席科学家吴恩达在百度语音开放平台上线三周年活动上,发布了百度四项最新语音技术——情感合成、远场方案、唤醒二期技术和长语音方案,并宣布这些技术通过免费接口提供给开发者使用。这在一定程度上促进了语音输入技术的发展,让更多的用户采纳语音输入。 近日,百度第68期技术沙龙以“移动端输入法性能优化实战”为主题,在北京互联网创业者聚集的车库咖啡举行。百度输入法工程师团队从iOS输入法启动速度和内存优化措施,人工智能在手写引擎中的应用、输入体验的提升,以及智能语音输入的技术核心、实现方式、优化细节等方面,分享了百度当前最新技术和解决方案。 百度资深研发工程师范敏虎以“iOS输入法启动速度优化”为主题,分享了百度输入法在启动时间及运行内存方面优化的心得。百度输入法iOS版本,表面上看仅仅是一个面板,但是麻雀虽小五脏俱全,输入法开发甚至会面临比普通app更多的技术问题。范敏虎介绍了百度输入法在启动过程中,需要进行的三个步骤及整个启动过程里可能会遇到四个问题。结合iOS输入面板的启动时间、稳定性问题以及面板上多次弹窗等问题,范敏虎生动形象地讲解了问题的解决方案。 在如何提高用户输入体验以及新技术的调研应用方面,百度资深研发工程师贺亮为现场的听众带来了一场精妙绝伦的经验分享。作为百度手机输入法内核算法核心开发人员,贺亮解析了百度输入法第一代的模式识别技术存在的问题,同时介绍了基于深度学习网络技术的第二代手写引擎技术试验方案及其优点。结合具体事例,贺亮讲解了不同模型的区别,以及如何通过手机硬件加速技术控制深度神经网络计算带来的性能损耗。 在移动智能设备普及的大势下,输入法与人工智能结合的语音输入应用场景变得越来越广泛。百度手机输入法Android团队经理、技术负责人施聪和百度语音开放平台资深研发工程师魏利开,分别从语言技术跟输入法结合,以及案例方向的角度,介绍了百度语音输入法具体的实现方式和优化细节。 在案例分享环节,魏利开介绍道,百度语音的识别准确率已经全球领先。 百度技术沙龙是由百度开发者中心主办的线下技术交流活动,每月1期,旨在为中高端技术人员提供一个自由的技术交流和分享的平台。百度开发者中心通过百度的技术开放、搜索推广和应用分发能力,助力开发者加速成功,致力于为开发者、消费者和百度提供创新共赢的生态格局。 (责任编辑:) |