未分類

ページランク

投稿日:

インターネットにより世界中のユーザーがウェブページを閲覧できるようになり少しでも疑問に思ったことをネットでキーワードを打てば見たいものがすぐに出てきます。ウェブページの量は膨大なのですが一体どのように検索したページが決められるのでしょうか。それはGoogleの検索エンジンを例に出して説明することができます。Googleの検索エンジンはページランクという検索エンジンを使っています。これはそれぞれのウェブページにランキングをつけてそのランキング上位のものから検索結果に表示されるというものです。それではどのようにランキングが決められているのでしょうか。まず最初にキーワードがタイトルや内容に含まれているのかをウェブページを読み込んでそのキーワードが含まれているページに限定します。そのページの中からランキング順に表示させていくのですが、ウェブページにはリンクを貼ってそのリンク先のウェブページに飛ぶことができるようにする機能があります。リンクが貼られているページはその記事のクオリティーや信頼性が高いと判断することができるのでリンクが貼られている数を数えそれをランキングに反映させます。リンク元がさらにリンクが貼られている数も勘定します。これはGoogleの検索エンジンのアルゴリズムの数百周類のうちの一つですが、どのようにページランクをしているかを知るためにはいくらか有用でしょう。

フィルターバブル・エコーチェンバー

この検索エンジンは自分が過去に見た記事に似た記事がページランクで上に来るような仕組みも備わっているため、いくらか意見が偏ってしまうことに注意しないといけません。検索エンジンは自分が見たい情報を提供することは得意なのですが、自分の見たいものではない情報は当然ですが提供してくれません。もちろん見たい情報を効率良く探し出し知識を蓄えることは素晴らしいことだと思うのですが、このアルゴリズムは言ってしまえば自分が知りたいと思った情報しか提供してくれないと言い換えることができます。検索エンジンは自分の意見は正しいと言ってくれてどんどんその深みにハマってしまう恐れがあるのです。人間は千差万別でいろんな考え方の人がいます。自分とは違う考え方の人の意見をきいて、なんでこういうことを考えているのかを考えることは大事なことだと思うので、検索エンジンを使う際にはフィルターバブルが発生することを念頭においてググりたいと思います。

-未分類

執筆者:


  1. 天才 より:

    ひと昔前にリンクをたくさん貼っただけ、人と結託して相互リンクを貼りまくることで
    質の低いウェブサイトが上位表示されるということがあったなのでアルゴリズムを知られることは問題になるかもしれませんね。

    また情報の偏りについては自分に都合の良い情報を集める「確証バイアス」と似ていますね。常に情報を疑う、あえて反論を考えてみるなどしてみると良いかもしれませんね。

    • hyou より:

      これの対策として不正のあるwebサイトを検出するアルゴリズムが現在使われているようです。

  2. 天才 より:

    どんなアルゴリズムで不正を検出するのか気になりますね

comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

no image

ビンゴゲーム

明日は企業さんの面接で自分の作ったプログラムを説明しなければいけないのでその練習をします。 1、ビンゴカードの作成 BingoCardクラスを作成し、その中でinitializeメソッドでインスタンス …

no image

面接!

 明日は面接なので、短めにしたいと思います。今まで面接をしてこなかった人生なので、ここらで鞭を打ちたいと思います。はい、前職では電気工事を行っておりました。具体的には新築建造物や工場などの電気供給に必 …

no image

Java3

 今日はカプセル化について学習しました。カプセル化とは定義したフィールドやメソッドを他のクラスで使用する際に予想外の値を入れてエラーを起こさないように同じクラス内や同じパッケージ内でしか呼び出せないよ …

no image

歌舞伎

 今日から「歌舞伎入門」を読んでいます。全く未知の世界なので少しワクワクです。少ししか見ていないのですが、今までのところを書きます。歌舞伎は日本のワビサビとは結構対極的にある立ち位置で、市民の感情を爆 …

no image

パッケージ

今日は普段使っているパッケージについて学びました。いつもパッケージ管理ソフトのyarnを使ってインストールやら実行やらを行っているのですが、それが内部でどのような動きをしているのかなんて考えたこともあ …