こんにちは!
突然ですが、iPhoneで音声入力って使ってますか?
標準のApple音声入力、悪くはないんですけど……「えーと」「あのー」がそのまま入るし、句読点もおかしいし、文脈を理解してくれない。結局、手で直す時間のほうが長くなって「もう自分で打ったほうが早いわ」ってなりがち。
で、Wispr FlowやSuperWhisperみたいなAI音声入力アプリが出てきたんですよね。めっちゃ便利。ただ、月額$15(約2,200円)とか$8.49(約1,300円)。年間にすると2〜3万円。音声入力にそこまで出せるかって聞かれると、ちょっと悩む。
そこに、Googleがとんでもないものを出してきました。
2026年4月6日、ひっそりとApp Storeに登場した Google AI Edge Eloquent。完全無料。使用制限なし。しかもオフラインで動く。
今日はこのアプリを実際に触ってみた所感と、有料ライバルとの比較を書いてみます。
Google AI Edge Eloquentって何?
ひとことで言うと、GemmaベースのオンデバイスAI音声入力アプリです。
Gemmaというのは、GoogleがオープンソースでリリースしているAIモデル。Geminiの弟分みたいな存在で、軽量だけどめちゃくちゃ優秀。EloquentはこのモデルをまるごとiPhone上で動かしています。
つまり、音声データがサーバーに送信されない。全部がiPhoneの中で完結する。プライバシー重視の人にとっては、これだけで選ぶ理由になるかなと思います。
ちなみに、Googleのプレスリリースとかは一切なし。App Storeにひっそり登場しただけ。GIGAZINEやTechCrunchが見つけて報道したことで広まりました。こういう「黙って出す」スタイル、個人的にはけっこう好きです。
ダウンロード: App Store
どうやって始めるの?
セットアップはびっくりするほどシンプルです。
- App Storeからダウンロード(無料、約300MB)
- マイクの許可 を出す
- 話し始める — それだけ
アカウント作成不要。サブスク登録もなし。広告もなし。起動してすぐ使えます。
ただし注意点がひとつ。現時点では日本のApp Storeに掲載されていない可能性があります。米国のApp Storeでは確認済み。日本リージョンのApple IDだとダウンロードできない場合は、米国アカウントが必要になるかもしれません。
機能を実際に触ってみた
リアルタイム文字起こし
話すと同時にテキストが表示されます。遅延はほとんど感じない。オフラインなのにこの速度は正直びっくりしました。
フィラーワード自動除去
「えーと」「あの」「um」「ah」みたいなフィラーワード(つなぎ言葉)を、話すのを止めたタイミングで自動的に削除してくれます。
これがめっちゃ便利。普通に喋ると、人間って驚くほどフィラーが多い。録音を文字起こししたことがある人ならわかると思いますが、読み返すと「え、こんなに言ってたの?」ってなるやつです。
4つのテキスト変換モード
文字起こしが終わったあと、テキストをワンタップで変換できます。
| モード | 内容 |
|---|---|
| Key Points | 要点を箇条書きで抽出 |
| Formal | ビジネスメール調に書き換え |
| Short | 文章を短く要約 |
| Long | 内容を膨らませて拡張 |
実は、これが一番ヤバい機能かもしれません。音声入力って、話した内容をそのままテキストにするだけだとまだ「下書き」なんですよね。それをワンタップで整えられるのは、地味だけど革命的。
カスタム辞書 & Gmail連携
固有名詞や専門用語を辞書に登録できます。手動で追加もできるし、Gmailアカウントから頻出ワードをインポートする機能もある。
たとえば「Kubernetes」とか「Next.js」みたいな技術用語、人名、社内用語。こういうのを事前に登録しておくと、認識精度がグッと上がります。
ワードカウント & WPMトラッキング
セッションごとに総単語数と「Words Per Minute(1分あたりの発話語数)」が記録されます。ライティングの生産性を数値で見たい人には嬉しい機能。
オフラインモード vs クラウドモード
Eloquentには2つの動作モードがあります。
オフラインモード(デフォルト):
- GemmaベースのASRモデルがiPhone上で動作
- 音声データは端末外に一切出ない
- インターネット接続不要
- プライバシー最強
クラウドモード(オプション):
- テキスト後処理にGeminiモデルを使用
- より自然な文章への変換が可能
- インターネット接続が必要
個人的には、オフラインモードで十分かなという印象です。飛行機の中、地下鉄、通信制限中でも使えるのは大きい。クラウドモードは「もう一段階キレイにしたい」ときの選択肢として良い感じ。
できないこと(正直に書きます)
良いことばかり書いてもフェアじゃないので、現時点の制限をまとめます。
英語のみ対応
これが日本語ユーザーにとって最大の壁です。
現時点で対応言語は英語のみ。日本語の音声入力には使えません。日本のiPhoneシェアは約50%、つまり日本人の半数がiPhoneを使ってる国なので、日本語対応が来たらインパクトは相当大きいはず。でも今はまだ。
ただ、英語でメールを書く、英語の議事録をとる、英語学習のスピーキング練習に使う、といったユースケースなら今すぐ活用できます。
iOS限定(Android版は開発中)
App Storeのリスティングに「Android版」への言及があるので、開発中なのは間違いなさそう。ただ、具体的なリリース日は不明。
キーボード統合なし
LINEやSlack、メモアプリ内で直接音声入力する、みたいなキーボード連携はまだありません。Eloquentアプリ内で文字起こし→コピー→貼り付け、という流れになります。
Wispr Flowが強いのはまさにここで、どのアプリでもキーボードとして使える。この差は現時点ではけっこう大きい。
競合5アプリとの徹底比較
さて、本題。有料ライバルたちとどう違うのか、表にまとめました。
| 項目 | Google AI Edge Eloquent | Wispr Flow | SuperWhisper | Otter.ai | Apple標準音声入力 |
|---|---|---|---|---|---|
| 月額料金 | 無料 | $15(約2,200円) | $8.49(約1,300円) | $16.99(約2,500円) | 無料 |
| 年間コスト | 0円 | 約26,400円 | 約15,600円 | 約30,000円 | 0円 |
| オフライン動作 | はい(デフォルト) | いいえ(クラウド専用) | はい(Apple Silicon) | いいえ | はい |
| AI文章整形 | はい(4モード) | はい | はい | 限定的 | なし |
| フィラー除去 | 自動 | 自動 | 自動 | 自動 | なし |
| カスタム辞書 | はい(Gmail連携) | はい | はい | いいえ | いいえ |
| キーボード統合 | なし | あり(最大の強み) | あり | なし | あり |
| 対応言語 | 英語のみ | 英語中心 | 多言語 | 英語中心 | 多言語 |
| プライバシー | オンデバイス処理 | クラウド送信 | オンデバイス | クラウド送信 | オンデバイス |
| 対応OS | iOS | macOS | macOS/iOS | iOS/Android/Web | iOS |
| WPMトラッキング | あり | なし | なし | なし | なし |
ざっくりまとめると
- コスパ最強:Eloquent(無料で4つの変換モードまである)
- プライバシー最強:Eloquent & SuperWhisper(オンデバイス処理)
- 使い勝手最強:Wispr Flow(キーボード統合が圧倒的)
- 会議特化:Otter.ai(話者分離、会議連携が充実)
- お手軽さ:Apple標準(追加アプリ不要、日本語OK)
あなたにとっての意味
「で、結局どういう人に向いてるの?」をもう少し具体的に。
英語でビジネスメールを書く人
海外クライアントとのやりとり、英文レポート。話しながら下書きして、Formalモードで整えれば完成。月2,200円のWispr Flowと同じことが無料でできます。
英語学習中の人
スピーキング練習にめっちゃ使える。自分の話した英語がリアルタイムでテキスト化されるから、発音の弱点が一目瞭然。WPMトラッキングで、スピーキング速度の成長も数値で追える。
フリーランスのライター・ブロガー
英語コンテンツを書いてる人。音声でバーッと話して、Key Pointsモードで構成出して、Longモードで展開。ライティングのワークフローが変わるかもしれません。
プライバシーを重視する人
日本はプライバシー意識が高い国。音声データが海外のサーバーに送られるのが気になる人にとって、オンデバイス処理は安心材料。機密情報を含むメモの音声入力にも使いやすい。
今は向いてない人
- 日本語で音声入力したい人 → まだ英語のみ。Apple標準かSuperWhisperを
- どのアプリでも音声入力したい人 → キーボード統合がないので、Wispr Flowの勝ち
- Android使ってる人 → もうしばらく待つ必要あり
個人的に思うこと
Googleがこれを無料で出してきたのは、けっこう大きなシグナルだと思います。
Wispr Flowは月$15、年間$180。SuperWhisperも年$100。ユーザーがこれらに課金してきたのは、Apple標準の音声入力では足りなかったから。そこにGoogleが「オンデバイスAIで全部やります、無料で」と殴り込んできた。
もちろん、現時点ではキーボード統合がないとか、英語のみとか、制限はある。でも無料アプリに「完璧じゃない」と文句を言うのもフェアじゃないですよね。
実は、もっと注目すべきはこの先の展開かなと思っていて。GemmaベースのオンデバイスAIがここまでできるなら、多言語対応、キーボード統合、Android版……Googleのリソースがあれば時間の問題かもしれません。
日本語対応が実現したら、やばいことになりそうです。日本のiPhoneシェア(約50%)を考えると、インパクトは計り知れない。
まとめ
Google AI Edge Eloquentは、「音声入力に月額課金するのは当たり前」という空気をひっくり返すアプリです。
- 完全無料、使用制限なし
- Gemmaモデルによるオンデバイス処理
- フィラーワード自動除去
- 4つのテキスト変換モード
- Gmail連携のカスタム辞書
- WPMトラッキング
制限: 英語のみ、iOS限定、キーボード統合なし
英語の音声入力がメインなら、まず試してみて損はないです。無料だし。合わなければアンインストールすればいいだけ。
日本語対応を待ちつつ、英語のユースケースから始めてみるのが賢い使い方かなと思います。
ダウンロードはこちら: App Store
少しでも参考になれば幸いです。最後までお読みいただきありがとうございました!
ソース
- GIGAZINE — Googleが無料で使える音声認識ツール「Google AI Edge Eloquent」をひっそりリリース
- TechCrunch — Google quietly launched an AI dictation app that works offline
- 9to5Google — Google AI Edge Eloquent is an offline voice dictation app
- HelenTech — Google、iOS 向け文字起こしアプリ「Google AI Edge Eloquent」を海外でリリース
- Android Authority — Google takes on Wispr Flow with new offline AI dictation app
- The Next Web — Google quietly releases free offline AI dictation app for iPhone
- Yahoo!ニュース — グーグル、iPhone向け無料音声入力アプリ公開 オフライン利用に対応
- Neowin — Google AI Edge Eloquent is a Gemma-powered dictation app that works offline