mocoVoiceを利用する際には、以下の点にご留意ください。
mocoVoiceでは、同じ音声を処理した場合でも、常に同一の結果が得られるとは限りません。これは、継続的なAIモデルの更新による精度向上や、サーバーの負荷状況に応じた処理調整が行われるためです。
音声認識は確率的な処理に基づいているため、結果の完全な一貫性を保証することは困難です。アプリケーションを設計する際は、認識結果のテキスト表記に過度に依存しないように考慮してください。
mocoVoiceで処理できるファイル形式、サイズ、音声の長さには制限があります。最適なパフォーマンスを得るためには、推奨される形式をご利用ください。
詳細については、以下のページをご参照ください。
👉 対応ファイル形式
mocoVoiceはクラウドベースのサービスであり、システム負荷に応じて自動的にスケールします。そのため、書き起こし処理の完了までにかかる時間(レスポンス時間)は、音声ファイルの長さやサーバーの混雑状況によって変動する可能性があります。一定のレスポンス時間を保証するものではありませんのでご了承ください。
書き起こし精度は、入力される音声の品質に大きく影響されます。
上記のような場合、認識精度が低下する可能性があります。可能な限りクリアな音声を録音・入力することで、より良い結果が期待できます。
mocoVoiceは多くの言語に対応していますが、対応言語リストに含まれていない言語や、方言、非常に強いアクセントが含まれる音声については、認識精度が低下する可能性があります。
対応している言語の完全なリストは、以下のページでご確認いただけます。
👉 対応言語