23か月前公開・23か月前更新・5 min read

Re VOICEVOXで高クオリティな音声合成を... | Docker & nodejs 編

pythondockertypescriptvoicevox音声合成nodejs

https://cdn.magicode.io/media/notebox/b94f5266-bf66-46e7-9ab6-07543964559a.jpeg

※ この記事は、以前書いたものの修正版です。https://zenn.dev/ddpn08/articles/fb390caa781e54

こんにちは。前書いた記事を見返してたらなんかすごい適当だな... って思ったので少し書き直します。
今回はとっても高クオリティかつ可愛らしい音声合成が行えるvoicevoxを使ってみます。

VOICEVOX とは

高品質な音声合成ソフト

https://voicevox.hiroshiba.jp/

無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのエディター

と、書かれていますが、正直中品質なんてもんじゃあありません。
めちゃくちゃ高品質です。サンプルを上記ページから聞けるので、ぜひ聞いてみてください。

かんたんに使える

デスクトップ環境ではGUIでかんたんに音声合成が可能です。
最近ではYouTubeでも、VOICEVOXを使用した動画もかなり見かけますね。

また、voicevox-engineというapiが公開されているのでhttpリクエストを送るだけでかんたんに音声合成が可能です。
Dockerイメージも公開されているので手軽に起動できます。

Ads

Commutty IT ADS

記事を書いた人に広告収入が入る、そんなエンジニア向けブログサービスに広告を掲載しませんか？

Go!!

っということで今回はDockerとNodeJsを使って音声を合成してみます。
※ある程度DockerとNodejs(Typescript)の知識があることを前提に進めます。

Dockerでエンジンを起動

今回はdocker-composeを使ってエンジンを起動します。

version: "2"
services:
  voicevox_engine:
    # CPUの場合は voicevox/voicevox_engine:cpu-ubuntu20.04-latest を使用
    image: voicevox/voicevox_engine:nvidia-ubuntu20.04-latest
    ports:
      - "50021:50021"
    tty: true
    #
    # 以下の項目はCPUの場合はなくても大丈夫
    #
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: 1
              capabilities: [gpu]

docker-compose.ymlを保存したら実行。

docker-compose up

コードを書く

環境

nodejs v18
yarn v3.1.0
typescript v4.5.5

voicevox-engine用のモジュールを作成したのでよければ使ってください。
apiドキュメントがあるのでこちらでより詳しい内容を確認できます。

モジュールのインストール

npm i voicevox-api-client --save
# yarn add voicevox-api-client,
# npm add voicevox-api-client, etc...

コードを書く

mjsで書きます。

指定された文字列を音声合成してファイルを書き出す関数を作ってみます。
とりあえず全体のコードを。

// index.mjs

import { Client } from 'voicevox-api-client'
import fs from 'fs'

const client = new Client('http://localhost:50021')

const createVoice = async (text: string) => {
  const query = await client.query.createQuery(0, text)
  const voice = await client.voice.createVoice(0, query)
  const buf = Buffer.from(voice)
  fs.writeFileSync('voice.wav', buf)
}

createVoice("Dockerがどっかーん")

順番に説明していきます。

まず一番上のほう。
書いてあることそのまんまです。
モジュールからClientをインポートしてインスタンスを作成しています。
ここのURLは先程作成したvoicevox-engineのサーバーのURLにしてください。

// index.mjs

import { Client } from 'voicevox-api-client'
import fs from 'fs'

const client = new Client('http://localhost:50021')

次に一番大事なcreateVoice関数。
まず文字列からクエリを作成します。
次に作成したクエリを音声に変換します。
voiceに音声のarrayBufferが入るのでBufferに変換してファイルに書き出します。

// index.mjs

const createVoice = async (text: string) => {
  const query = await client.query.createQuery(0, text)
  const voice = await client.voice.createVoice(0, query)
  const buf = Buffer.from(voice)
  fs.writeFileSync('voice.wav', buf)
}

はい！完成です！
早速実行してみましょう。

node index.mjs

終わったあとに、ディレクトリを見てみると...

wavファイルが生成されていますね！
再生すると、ちゃんと声が再生されるはずです。
めちゃめちゃかんたんですね！

Ads

Commutty IT ADS

記事を書いた人に広告収入が入る、そんなエンジニア向けブログサービスに広告を掲載しませんか？

Done!!

今回はDockerとNodejsでVOICEVOXを使ってみました。
ほんとに音声の質がすばらしいですし、これが無料で使えるなんて素敵です。
こんどはDiscordjsと組み合わせて、チャット読み上げBOTの作り方とかを書くかもしれないです。

Discussion

コメントにはログインが必要です。

Ads

Commutty IT ADS

記事を書いた人に広告収入が入る、そんなエンジニア向けブログサービスに広告を掲載しませんか？