未分類

ページランク

投稿日:

インターネットにより世界中のユーザーがウェブページを閲覧できるようになり少しでも疑問に思ったことをネットでキーワードを打てば見たいものがすぐに出てきます。ウェブページの量は膨大なのですが一体どのように検索したページが決められるのでしょうか。それはGoogleの検索エンジンを例に出して説明することができます。Googleの検索エンジンはページランクという検索エンジンを使っています。これはそれぞれのウェブページにランキングをつけてそのランキング上位のものから検索結果に表示されるというものです。それではどのようにランキングが決められているのでしょうか。まず最初にキーワードがタイトルや内容に含まれているのかをウェブページを読み込んでそのキーワードが含まれているページに限定します。そのページの中からランキング順に表示させていくのですが、ウェブページにはリンクを貼ってそのリンク先のウェブページに飛ぶことができるようにする機能があります。リンクが貼られているページはその記事のクオリティーや信頼性が高いと判断することができるのでリンクが貼られている数を数えそれをランキングに反映させます。リンク元がさらにリンクが貼られている数も勘定します。これはGoogleの検索エンジンのアルゴリズムの数百周類のうちの一つですが、どのようにページランクをしているかを知るためにはいくらか有用でしょう。

フィルターバブル・エコーチェンバー

この検索エンジンは自分が過去に見た記事に似た記事がページランクで上に来るような仕組みも備わっているため、いくらか意見が偏ってしまうことに注意しないといけません。検索エンジンは自分が見たい情報を提供することは得意なのですが、自分の見たいものではない情報は当然ですが提供してくれません。もちろん見たい情報を効率良く探し出し知識を蓄えることは素晴らしいことだと思うのですが、このアルゴリズムは言ってしまえば自分が知りたいと思った情報しか提供してくれないと言い換えることができます。検索エンジンは自分の意見は正しいと言ってくれてどんどんその深みにハマってしまう恐れがあるのです。人間は千差万別でいろんな考え方の人がいます。自分とは違う考え方の人の意見をきいて、なんでこういうことを考えているのかを考えることは大事なことだと思うので、検索エンジンを使う際にはフィルターバブルが発生することを念頭においてググりたいと思います。

-未分類

執筆者:


  1. 天才 より:

    ひと昔前にリンクをたくさん貼っただけ、人と結託して相互リンクを貼りまくることで
    質の低いウェブサイトが上位表示されるということがあったなのでアルゴリズムを知られることは問題になるかもしれませんね。

    また情報の偏りについては自分に都合の良い情報を集める「確証バイアス」と似ていますね。常に情報を疑う、あえて反論を考えてみるなどしてみると良いかもしれませんね。

    • hyou より:

      これの対策として不正のあるwebサイトを検出するアルゴリズムが現在使われているようです。

  2. 天才 より:

    どんなアルゴリズムで不正を検出するのか気になりますね

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

諸々

品質について Q・C・Dはトレードオフだということを学びました。品質を高くすればコストが高くなるし時間だってかかります。コストを安くすれば品質が悪くなります。納期を遅らせれば品質よく安いものが出来上が …

no image

1日休み

 今日は1日休みだったのでダラダラしていました。linuxを勉強したのでそのことを書きます。コンピュータは大きくソフトウェアとハードウェアに大別することができて、ソフトウェアをさらに分けると基本ソフト …

no image

時間の使い方

「時間の使い方を科学す」という本を読んでいます。この本は時間をうまく使う方法について書かれています。 サーカディアンリズム 地球では二十四時間周期で太陽が昇ったり沈んだりを繰り返す周期が存在します。こ …

no image

認識とは

 「動物と人間の世界認識」の続きを読んでいます。他の動物と人間の見ている世界は全然違うということがわかりました。例えばモンシロチョウは人間がみることができない紫外線をみることができ、逆に赤い色をみるこ …

no image

ジャンヌダルクとは

 今日は何もなかったので本を読んでいました。「日本史で学ぶ経済学」を読み終わり「ジャンヌダルクの生涯」を読んでいます。まずは前者の方から書きたいと思っていて、この本で学んだことは今のシステムは過去に作 …