ProjectP-文字起こし君

更新

openai-whisper をローカル実行するデスクトップGUI。 音声/動画から字幕ファイルや文字起こしテキストをまとめて生成できます。

Stripe 決済で購入できます。既存購入者は 購入済みの方ページ からライセンス確認と再ダウンロードができます。

購入前に 特定商取引法に基づく表記利用規約返金・キャンセルポリシープライバシーポリシー を確認してください。

購入前の確認

購入前に販売条件を確認し、同意したうえで Stripe Checkout へ進んでください。 決済完了後にライセンスキーを発行し、購入時のメールアドレス宛に案内します。

購入後は 購入完了ページ で決済状況とライセンス発行状況を確認できます。

販売形態

買い切り 500円 の個人向けライセンスです。 Stripe Checkout を通じて決済し、1ライセンスで 1台まで 認証できます。

  • 価格は 500円
  • 決済は Stripe Checkout
  • 既存購入者はライセンス照会ページを引き続き利用可能
  • ライセンスキーの再確認と機種変更申請は継続対応

購入後の流れ

すでに購入済みの場合は、注文IDと購入メールアドレスをもとにライセンスを確認できます。メールが見つからない場合でも、購入済みページから照会できます。端末移行が必要な場合は購入後ページから申し込めます。

  1. 購入済みページで注文IDと購入メールアドレスを入力する
  2. ライセンスキーを確認して保存する
  3. アプリ側の認証画面でメールアドレスとライセンスキーを入力する
  4. 端末を移行する場合は購入後ページの 機種変更を申し込む から手続きする

購入済みの方はこちら

納品内容と認証

現在は既存購入者向けに、インストーラーライセンスキー の再確認導線を維持しています。 ライセンスキーは購入済みページと案内メールから確認できます。認証は購入メールアドレスとライセンスキーで行い、現在の利用条件は 1ライセンス1台 です。

  • 納品物は インストーラーライセンスキー
  • ライセンスキーは画面とメールの両方で確認可能
  • 再確認は 購入済みの方ページ から可能
  • 端末を変更する場合は購入済みページから機種変更申請が必要

できること

音声や動画ファイルを選んで、そのままローカルで文字起こしできます。 字幕として使いやすい .srt.vtt、確認用の .txt、 後処理向けの .json までまとめて出せる構成です。

  • .mov を含む音声・動画ファイルに対応
  • モデル、言語、タスク、デバイス、Temperature(s) を細かく指定可能
  • 進捗バーとステータス表示で処理状況を追える
  • バックグラウンド処理で UI フリーズを避けやすい

精度と補正

そのままでも使えますが、ノイズ抑制や再補正を有効にすると、字幕として使うときの安定感が上がります。 環境によって追加依存がなくても動き、入っていれば自動で強い側を使います。

  • High accuracy mode で反復崩壊を抑える
  • Normalize loudnessVoice focus filter で音のばらつきやノイズを抑える
  • Silero VAD 優先、未導入時は既存 VAD へ自動フォールバック
  • WhisperX 補正や低品質行の再 ASR 比較に対応

精度を上げるコツ

日本語素材をしっかり文字にしたいなら、モデルサイズと前処理の設定が効きます。 迷ったときは下の組み合わせから始めると安定しやすいです。

  • Modelmedium 以上、可能なら large-v3 を推奨
  • 日本語素材は LanguageJapanese (ja) に固定
  • Task は通常 transcribeHigh accuracy modeNormalize loudness は有効推奨
  • BGMや環境音が強い素材では Voice focus filter を有効化
  • Temperature(s)0,0.2,0.4,0.6,0.8,1.0 を推奨

主な設定項目

単に文字を起こすだけでなく、速度重視か精度重視か、話者分離を使うか、出力名をどうするかまで画面から調整できます。

  • Speed priority mode で高速化重視に切り替え
  • Speaker split SRT (beta) で話者別 SRT を追加出力
  • 出力ファイル名(ベース名)を任意指定可能
  • Default Settings... で既定値の保存/リセット、反復テキスト検知時は自動リトライ

README