---
type: article
title: フィルタリングの進化と格付け語彙の役割
timestamp: 2008-07-23T00:00:00Z
profile: sorane-okf/0.1
noFontEmbedding: true
---

# フィルタリングの進化と格付け語彙の役割

<p>PICSやフィルタリングが出始めた頃、セルフラベルや第<a class="keyword" href="http://d.hatena.ne.jp/keyword/%BB%B0%BC%D4">三者</a>レイティングに使う語彙は、即ちサイトに対する分類そのものだった。ところがフィルタリング技術が文章や写真の中身を判断ようになり、レイティングそのものよりはフィルタリング・ソフトのロジックが振る舞いを決定するようになりつつある。有害コンテンツがアダルトから<a class="keyword" href="http://d.hatena.ne.jp/keyword/CGM">CGM</a>へと変遷し、PICSがサイトに<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%E1%A5%BF%A5%C7%A1%BC%A5%BF">メタデータ</a>を付与するPOWDERへと発展解消し、サイトの爆発的増加に対応して自動レイティングの割合が高まったとき、ICRAやSafety Onlineといった語彙の役割はどうなっていくのか。

<br />
徐々にサイト分類そのものとして直接参照される割合が減ってくる一方で、相互運用性の高いWeb<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%E1%A5%BF%A5%C7%A1%BC%A5%BF">メタデータ</a>体系として、レイティング事業者・窓口機関・フィルタリング・ベンダ間のデータ交換の規格としては生き残り続けるだろう。それらは直接参照されるURLデータベースとしてではなく、自動レイティング辞書のデータソースや、フィルタリング・ソフトの<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%D9%A5%F3%A5%C1%A5%DE%A1%BC%A5%AF">ベンチマーク</a>、運用実態に関する評価情報の交換といった使途に使われるのではないか。<br />
<a class="keyword" href="http://d.hatena.ne.jp/keyword/CGM">CGM</a>サイトが増え、それを精緻にフィルタリングする社会的要請が高まった場合に、サイトの外形要件に基づいて手動レイティングされたURLデータベースを参照するのではなく、書き込まれているコンテンツを自動レイティングし、フォーム入力や<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%BD%A1%BC%A5%B7%A5%E3%A5%EB%A5%B0%A5%E9%A5%D5">ソーシャルグラフ</a>、プロフィール検索といった構成要素を自動識別して、必要に応じて書き込みの抑止などを行うことが予想される。<br />
そうなった時、<a class="keyword" href="http://d.hatena.ne.jp/keyword/CGM">CGM</a>サイトの属性を示す<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%DC%A5%AD%A5%E3%A5%D6%A5%E9">ボキャブラ</a>リが不要かというと、そうでもなくて、フィルタリング・ソフトが<a class="keyword" href="http://d.hatena.ne.jp/keyword/%B5%A1%B3%A3%C5%AA">機械的</a>に検知すべき属性について、<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%DC%A5%AD%A5%E3%A5%D6%A5%E9">ボキャブラ</a>リが定義され、手動でのレイティング・サンプルが提供されることが実は重要だ。というのも、フィルタリング・ソフトがそういった属性を自動レイティングできるようにするためには、<a class="keyword" href="http://d.hatena.ne.jp/keyword/%B5%A1%B3%A3%B3%D8%BD%AC">機械学習</a>や識別率ベンチマーキングのための元データが必要で、そのためには属性を示す<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%DC%A5%AD%A5%E3%A5%D6%A5%E9">ボキャブラ</a>リがあった方が便利だろう。<br />
格付け語彙と、フィルタリング・ソフトのカスタマイズ項目とかフィルタリングの振る舞い自体とは切り離し、共通の語彙が充実することによってサイトに関する<a class="keyword" href="http://d.hatena.ne.jp/keyword/%A5%E1%A5%BF%A5%C7%A1%BC%A5%BF">メタデータ</a>を効率的に集約し、自動レイティングの精度を上げることが可能となることが重要なのではないか。<br />
また、<a class="keyword" href="http://d.hatena.ne.jp/keyword/%B5%A1%B3%A3%C5%AA">機械的</a>識別ができるところはレイティングが不要となるのではなく、常に機械識別と手動識別とを比較しメンテナンスし続けるためにも、全てといわず典型的なパターンについてサンプリング的に手動レイティングし続けることは今後も重要だし、そのためには識別すべき特徴を指し示す語彙を整備し続ける必要はあるのだろう。また、フィルタリングを過信せず、あくまで保護者が子どものネット利用を効率的に管理するための、自動化し得るワークフローの一部としてフィルタリングを位置づけることが現実的ではないか。</p>
