HTML5语音合成功能的实现_F11 - 专业站长和开发者的学习网站

分享到

HTML5语音合成功能的实现

html5 来源：互联网搜集作者：秩名发布时间：2019-05-19 11:16:32 人浏览

摘要

本篇文章介绍HTML5语音合成功能的实现。听一下就会发现，播放出来的声音并不是预先录制好的音频资料，而是通过文字识别后合成的语音请先戴上耳机，然后将下面的代码复制到chrome控制台中体验～ let msg = new SpeechSynthesisUtterance(欢迎你阅读我的博客

本篇文章介绍HTML5语音合成功能的实现。

听一下就会发现，播放出来的声音并不是预先录制好的音频资料，而是通过文字识别后合成的语音

请先戴上耳机，然后将下面的代码复制到chrome控制台中体验～

let msg = new SpeechSynthesisUtterance("欢迎你阅读我的博客");
window.speechSynthesis.speak(msg);

看，前端实现语音合成并不难

今天的主角 Speech Synthesis API

通过上面的例子我们可以猜测到上面调用的两个方法的功能

SpeechSyntehesisUtteranc
window.speechSynthesis.speak

当然了，语音合成不仅仅包含这两个API，but我们先从这两点入手

SpeechSyntehesisUtteranc

参考：developer.mozilla.org/en-US/docs/… SpeechSyntehesisUtteranc 对象包含了语音服务要读取的内容和一些参数，比如语言，音高和音量

SpeechSyntehesisUtteranc()
SpeechSynthesisUtterance.lang
SpeechSynthesisUtterance.pitch
SpeechSynthesisUtterance.rate
SpeechSynthesisUtterance.voice
SpeechSynthesisUtterance.volume

注意：以上属性都是可读写的！可以把下面这段代码copy下来尝试一下，注释中会有说明

let msg = new SpeechSynthesisUtterance();
msg.text = "how are you" // 要合成的文本
msg.lang = "en-US" // 美式英语发音（默认自动选择）
msg.rate = 2  // 二倍速（默认为 1，范围 0.1～10）
msg.pitch = 2 // 高音调（数字越大越尖锐，默认为 1，范围 0～2 ）
msg.volume = 0.5 // 音量 0.5 倍（默认为1，范围 0～1）
window.speechSynthesis.speak(msg);

同时这个对象还可以响应一系列事件，可能会用到的：

start
end
boundary
pause
resume

借助这些事件我们可以完成一些简单的功能，比如英文句子的单词数量统计：

let count = 0; // 词语数量
let msg = new SpeechSynthesisUtterance();
let synth = window.speechSynthesis;
msg.addEventListener('start',()=>{
    // 开始阅读
    console.log(`文本内容： ${msg.text}`);
    console.log("start");
});
msg.addEventListener('end',()=>{
    // 阅读结束
    console.log("end");
    console.log(`文本单词（词语）数量：${count}`);
    count = 0;
});
msg.addEventListener('boundary',()=>{
    // 统计单词
    count++;
});

经过尝试，由于中文没有用空格将每个词语分开，所以会进行自动的识别，比如欢迎读者会被识别为欢迎和读者两个词语

SpeechSynthesis

参考： developer.mozilla.org/en-US/docs/…

说完了 SpeechSyntehesisUtteranc 我们再来看看 SpeechSynthesis

SpeechSynthesis 的主要作用是对语音进行一系列的控制，比如开始或者暂停

它有三个只读属性，表明了语音的状态：

SpeechSynthesis.paused
SpeechSynthesis.pending

同时还有一系列方法用来操作语音：

•SpeechSynthesis.speak() 开始读语音，同时触发 start 事件
•SpeechSynthesis.pause() 暂停，同时触发 pause 事件
•SpeechSynthesis.resume() 继续，同时触发 resume 事件
•SpeechSynthesis.cancel() 取消阅读，同时触发 end 事件

基于这些操作方法，我们可以进一步增强我们的文字阅读器：

回到最初的起点

让我们回到最初的起点，我们可以基于上面的内容猜测一下有些网站中，文章的自动阅读是怎么实现的

如果这个网站前端采用了 MVVM 框架（以 Vue 为例），那么文章内容是也许存储在 data 中，可以用来构造我们需要的语音合成

当然，也有可能文章是通过 ajax 请求得到的，解析请求的数据，构造语音合成对象

如果文章是直接在 html 中写死的，这个时候就需要对 DOM 进行解析，经过测试，即便是下面这样的混乱的结构

<div id="test">
    <p>1</p>
    <p>2</p>
    <ul>
        <li>3</li>
        <li>4</li>
    </ul>
    <table>
        <tr>
            <td>5</td>
            <td>6</td>
        </tr>
        <tr>
            <td>7</td>
            <td>8</td>
        </tr>
    </table>
    <img src="https://www.baidu.com/img/bd_logo1.png" alt="">
    9
</div>

直接通过 innerText 读取其中的文本，然后构造语音合成对象，也能按照期望顺序阅读（图片会被忽略）

当然如果我们想要忽略一些特殊的结构，比如表格，我们可以花一些精力在解析上，把我们不想要的数据或者 DOM 元素筛掉

不管怎样，我们都能找到合适的解决方案～

闲话

这个特性，是一个还在草案中的特性，没有被广泛支持

再次强调，这个 API 暂时还不能应用到生产环境中

目前比较通用的做法是在后端构造将文本合成成语音文件的 API（也许是第三方 API），然后在前端作为媒体播放

曾经在我迷茫的时候，我去阅读一些大牛的文章，读到一些前辈对前端开发的思考。其中有一点令我印象深刻：

前端是最贴近用户的，一切要从用户的的角度考虑，无障碍使用也是一个很重要的课题。虽然做这样的功能带来的收益远远小于其他业务，但是为了让产品更好的服务用户，多付出一些劳动也是值得的，这也是前端开发的一种精神。

您可能感兴趣的文章 :

原文链接 : https://www.jb51.net/html5/673559.html

Tag : html5(144)

HTML5页面打开微信小程序功能实现

微信终于支持由页面跳转至小程序啦 ~ 步骤一：绑定域名登录微信公众平台进入公众号设置的功能设置里填写JS接口安全域名。步骤二：引
html5+实现plus.io进行拍照和图片等获取

使用Hbuilder开发工具开发：实现可对Android机进行控制和获取资源说明：IO模块管理本地文件系统，用于对文件系统的目录浏览、文件的读取
HTML标签实现带动画的抖音LOGO效果

先上结果，最终实现效果如下：还原度应该还可以吧？抖音Logo结构想要用CSS来画抖音的Logo，前提要先了解它的构造，一定是一些几何图形
video.js支持m3u8格式直播的实现教程

为什么要使用video.js？ 1. PC端浏览器并不支持video直接播放m3u8格式的视频 2. 手机端各式各样的浏览器定制的video界面风格不统一，直接写原生
html5调用摄像头截图功能的介绍

关于html5调用音视频等多媒体硬件的API已经很成熟，不过一直找不到机会把这些硬件转化为实际的应用场景，不过近年来随着iot和AI的浪潮，
前端监听websocket消息并实时弹出的代码实例介绍

本文默认您已掌握react生态开发的相关技术，并熟练应用umiJS的原则上，请继续！项目需求： 1、服务侧推送给消息给前端，前端需要展示在
HTML5新增内容和API介绍

classList 属性该属性用于在元素中添加，移除及切换 CSS 类。 classList属性返回元素的类名，作为 DOMTokenList 对象： div id=div class=test1 test2clas
使用canvas仿Echarts实现金字塔图的教程

最近公司项目都偏向于数字化大屏展示????，而这次发给我的项目原型中出现了一个金字塔图?????，好巧不巧，由于我们的图表都是使用Ech
基于HTML十秒做出淘宝页面的方法

十秒钟做出一个网页，可能大家看完会觉得有点标题党，其实不然，把别人的抠过来还是可以的比如我这次先把淘宝的网页扣过来为例第一
HTML5+CSS+JavaScript实现捉虫小游戏的代码

捉虫小游戏首页展示：选择昆虫：效果展示：有密集恐惧症的别玩哟、游戏永远不会停止一直玩项目源码结构：图片和js以及css等基础