F

2018/04/23

真面目にどうですかこれ


大橋彩香さんの2ndアルバムリード曲です。とても良い!!!!!!!

ビジネスになりそうなウェブサービス(ウェブアプリケーション)を思いついたのでメモ書き(割と真剣)。

【声優ラジオ全文検索システム】
◆概要
任意の文字列を検索語として入力すると、その検索語を含む声優ラジオのラジオ名、パーソナリティ等の基本情報とともに、ラジオ全文を返してくれる。
ラジオ全文は、
・ラジオ内容本文は.txtファイルを出力する。
・ウェブ上に直接表示する。
のいずれかもしくは両方。

検索ボックスは、
[ラジオ名](自由入力サジェスト→ドロップダウン)
[第n回]
[パーソナリティ名]*n個(自由入力サジェスト→ドロップダウン)
[放送日](カレンダー)
[本文](自由入力)
とかで。どっか一箇所入ってれば検索実行可能。

※例:
①ラジオ名に「フレームアームズ」を入力→「ラジオフレームアームズ・ガール」がサジェストされる。
②本文に「がんばるぞい」と入力して検索。他は空欄。
③ラジオフレームアームズ・ガール第34回の.txtファイルと「がんばるぞい」の前後の文字を表示。(他の回でもがんばるぞいがあればそれもヒット)↓
1件ヒットしました。

ラジオフレームアームズ・ガール34.txtラジオ内容全文をクリックで落とせる。
長江「OKじゃあ次いってみよう」
綾瀬「はい」
佳穂「がんばるぞい
綾瀬「ぞいぞい」
長江「こちら、ラジオネームのえさんから頂きました」

◆機能
・本文以外での検索
→ざっくりラジオ名のみでの検索、パーソナリティ名のみでの検索等。
この場合は基本情報とヒットしたラジオの.txtファイルダウンロードリンクのみ結果表示される。

・ユーザーによる文字起こし済のラジオデータアップロード
→ツール作成者だけではどう考えても用意できるデータに限りがあるため、ラジオ名、パーソナリティ名等の基本情報とともに.txtファイルをアップロードできるフォームを設ける。アップロードされた情報はDBへ格納されて検索対象に。
以下フォーム案。
[ラジオ名を入力してください]
[パーソナリティ名を登録してください]*n個
[放送回数を入力してください]
[放送日を入力してください]
[全文データをアップロードしてください(.txt形式)]

◆課題
・声優ラジオの音声全ての文字列化
→控えめに言って無理がある。人力で文字起こしするのが早そうではある。(音声認識技術を使っても結局人間の耳で聞きながらの手直しが発生するため。)

・掛け合いの文字起こしや、相槌と発言の中間くらいの微妙な声の表現
→上で出した例の会話部分でも既に無数の文字起こしが難しい微妙な声があった。

・表記揺れ(させていただく or させて頂く等、挙げだしたらキリがない)への対応
→Googleの検索エンジンとかこの辺克服してるしそういうの流用で解決?

・著作権法違反?
→音声データ配布の場合は確実にアウト。文字起こしの場合はどうなんだろうか。

検索システムとしてはよくあるものだと思うので、文字列データの用意が最大の課題ですなあ。
あまりに無謀ですが需要あると思うんですよねえ。オタクってこういうの好きですし。

ということでどなたか頑張って実装してください。
暇があれば私がやりま………………………うーん、キツイ!w

0 件のコメント:

コメントを投稿