今話題の音声SNS「Clubhouse」を聴覚障害者が使ってみた

 

耳の可処分時間を押さえるために「これからは音声の時代」と西野亮廣さんは言います。実際にSpotify(スポティファイ)、緒方憲太郎さんのVoicy(ボイシー)、本田圭佑さんのNowVoice(ナウボイス)など音声プラットフォームサービスが盛況です。

そうした中、2021年1月からビジネス界隈を中心に一気に話題沸騰中なのが、Clubhouse(クラブハウス)。

招待枠が2枠と限られ、現在iPhoneだけでしか使えません。話題に先行するために、我先にと招待を請う書き込みも見かけました。他にも、某フリマアプリではアカウントの売買も横行したようです。

そんな加熱っぷりを横目に、音声かぁ、あんま関係ないかな~と私は思っていました。

 

すると、「聴覚障害者は、Clubhouseについてぶっちゃけどう思っているの?」という疑問と共に、友人から招待が飛んできました。

これは…やるしかない。

ということで、音声認識アプリへの接続の悪戦苦闘と、使用感を伝えていきます。

結論からいうと、私個人的に望む形の音声認識アプリへの接続には成功していません。(記事執筆時点)

 

使用感について

理由は後述するとして、使用感について。

まずアカウント登録作業も含め、ユーザーインターフェースは全部英語。登録の仕方や説明などは、検索すればたくさんあるのでそちらに譲ります。

人が集まっているルームがあり、その中で部屋主と何人かが会話しており、その他大勢がリスナーになっている形です。

そしてこのアプリはバックグラウンド再生がデフォで出来る。朝ご飯を食べつつWEBニュースを読みながら、プロのピアニストの演奏をリアルタイムで聞くというゴージャス体験が出来たりします。

いくつかのルームに入って、視聴して気づいたこと。

去年コロナ禍の中で、Zoomが一気に浸透したとき、カメラ画質を高くしたり照明で差をつけていく流れがありました。Clubhouseでもマイクの質なのか、音声の質にばらつきを感じました。聞きやすい人とガサゴソ音の混じった聞きにくい人の差が、音声SNSだからこそ際立つように感じます。マイクも質を追求する流れが起きるのでしょうか。

部屋の参加者と遠隔で音楽セッションをやる部屋では、セッションにClubhouseを利用していませんでした。外部オンライン会議ツールのほうで遠隔セッションをし、それをClubhouseに流すハイブリッド形式でした。

無料ウェビナーの集客でも、ZoomとClubhouseの両方で視聴者を集めている人もいたりします。

聴覚にハンデがある、あるいはそれらに関わっている人が集まった部屋もありましたが、ここでもやはりハイブリッド形式。当事者や話す人は別端末でZoomで繋がっておけば、カメラで読唇術もできるし、音声認識もさせられます。

正直、オンライン対談ライブ配信をすればよいので、Clubhouseをわざわざ使う理由はあまりないのかもしれません。やはり「たまたま部屋が開いたタイミングでフラッと入ってみた」人になんとなく聞いてもらえる。『音声Twitter』とも言われているように、TLにつぶやきが流れてたまたま目にするのと同様、音声でそういう使い方を目指す形でしょうか。

ただ、かえって時間を使いすぎるというデメリットも言われています。既に先行者の中には『Clubhouse疲れ』を起こしているという声も。

 

音声認識との接続(人工内耳)

iPhone/iPad × speech-to-text-webcam-overlay

私は基本的に、オンライン会議をするときは音声認識アプリ『speech-to-text-webcam-overlay』を使用しています。(紹介記事はこちら
カメラ画像の読唇術もしています。Bluetoothで人工内耳にPC音声も飛ばしています。そして、それら単体のみでの理解は難しく、それぞれをほんの少しずつヒントにし、脳内で推測を組み立てて相手の話を理解しています。

そうすると、ビジュアル情報がばっさりカットされているClubhouseでは、私にとって会話理解のヒントが欠けている状態です。

 

選択肢は、残ったヒントを最大限活用するか外部で補うか。ここからは、人工内耳をしている私の試行錯誤過程です。

ClubhouseアプリをiPhoneとiPadの両方に入れました。まずはiPad単体で使用できないか。

speech-to-text-webcam-overlayは、PC版GoogleChromeが動作の前提なので、iPad単体では「Clubhouseを流しながらChromeで音声認識させる」ということが出来ません。これはiPhoneも同様です。

iPhoneやiPadのChromeで使えない
iOS (iPhoneやiPad)のChromeは,中身がSafariのWebKitで実装されているため,音声認識に利用している Web Speech API が現段階では利用できません。PC版のChromeでアクセスしてください。
https://github.com/1heisuzuki/speech-to-text-webcam-overlay

 

 

iPhone/iPad × UDトーク

では、UDトークならどうでしょうか。

iPhone/iPadの場合、スピーカーで流してバックグラウンド再生にし、UDトークを起動してマイクボタンを押すと音声認識はしてくれる。

特にiPadの場合、Clubhouseの上にUDトークアプリを重ねるSlide Overが使えるため、誰が話しているかの把握も出来て良い。

 

スピーカーにする理由は、Bluetoothで人工内耳に音を飛ばしていると、UDトークがClubhouseの音声を拾わないから。

スピーカーは音が放散するため、Bluetoothのほうが音の認識力はあがります。

Bluetoothで人工内耳に音を飛ばしつつ、内部音をUDトークが拾うことがが可能ならば、いちいちPCを立ち上げることなくiPadだけで寝っ転がってClubhouseを楽しめそうなのですが…

何はともあれ誤変換は多いですが、この方法が現時点でまずまずの及第点です。

 

ノートPC × speech-to-text-webcam-overlay

PCで音声認識をさせるために、iPhoneの音声をノートPCに送り、なおかつノートPCからBluetoothで音声を人工内耳に飛ばす…。

これがやりたくてずっと四苦八苦しておりましたが、ノートPCに音を送る時点で挫折。無効なデバイスの表示をしてもライン入力が接続できない…。

有線接続を諦め、Zoomを2アカウントとってPCとiPhoneで起動し、Zoomを通して音声認識を試みたが、Zoomを起動した時点でClubhouse側が音を出さなくなる。

禁止事項の中に、録音などもダメ、外部に出すのもダメ。録画機能を使おうとすると警告が出るらしく、違反するとアカウントBAN(凍結)が実行されているようです。

Zoomによる音声の外部漏洩を防ぐために、きっとそうなっているのでしょう。

というわけで、私の試行錯誤はまだまだ途上です。海外の聴覚障害クラスタでも試行錯誤中のClubhouse。

  • Bluetoothで人工内耳に音を飛ばして聞くのは大前提
  • 音声認識がリアルタイムで出来ればOK

これを満たす方法を編み出した方いらしたらぜひ教えてください!

 

ぶっちゃけ、どう思っているの?

聴覚障害者によっては疎外感を感じている方も少なからずいらっしゃると思います。音声認識精度は低くても、今なんの話題なのか少しでもヒントがあれば、音の認識がしやすくなって会話にちょっとはついていける、という聴こえの人もいます。そしてその程度も、人によります。

Android勢だって使えないんだよと思うかもしれませんが、機種変すれば使えることと、障害によって出来ないことは同列に語れないと思っています。

Instagramのような写真オンリーSNSだと、視覚障害者は楽しめなかった。全ての人が初めから満足するようなサービスというものは、なかなかありません。それを目指すと、サービスの特色が薄れてしまいかねない。だから、所詮ツールは使い分ければよいのでしょう。

反面、アプリに限らず様々なサービスで、あまりにも人を選ぶものが多いのかなと。ハンデのある人が「あー…」と思うことが、ちょっとばかり多いぞっと思います。

私もそうですが、出来る限界まであれこれ工夫して試してもやっぱり限界があるなぁと思います。

誤解して欲しくないのは、皆と同じように出来ないことが悔しいのではありません。チャンスだったり情報だったりが得られるところまでたどり着いたけども、目の前でそれらがすり抜けていく感覚を味わうんです。ふと横を見たら、同様にたどり着いた人はもれなくゲットできているものが。

その時の私の感情を言語化するには、あまりにもそれが当たり前になりすぎて逆に難しい。「ああ、またか。」と思い、直視しても何も変わらないから、淡々と次に向かっている感覚です。

色んな意見があるかもしれません。
私の場合は聞こえる人並みになりたくてClubhouseの楽しみ方を追求しているというのではなく、聴覚障害者だって居るんだよという可視化のために、あえて人工内耳を強調したアイコンで部屋を回ってみたりしています。

ビジネスというジャンルで、聴覚障害当事者がもっと進出して欲しいから。