Senin, 06 Februari 2012

Rumus Matematika Rahasia PageRank Google

posted by: Dunia Andromeda

Bertahun tahun google pagerank telah menjadi sebuah rahasia besar di dunia maya dimana banyak orang berlomba lomba untuk memecahkan misteri tersebut. Dan saat ini rahasia besar tersebut telah terungkap ke publik.
Mari kita mulai dengan beberapa logika berikut ini. Internet sangat besar, sebaliknya website sangat kecil. Tidak heran, apabila sebuah website sangat sulit untuk menonjolkan diri dan bersaing dengan milyaran website serupa untuk menampakkan diri­nya kepada seluruh pengakses Internet.

Pengguna hanya bisa melihat suatu website apabila ia menjalankan pencarian di Google dan website tersebut berada paling atas dalam daftar hits. Hanya saja, apabila ada ratusan website serupa di Internet, yang mana yang akan tampil paling atas atau paling bawah dalam daftar hits? Jawabannya dituangkan ke dalam sebuah rumus algoritma PageRank.
Seperti kita ketahui, PageRank adalah sebuah algoritma yang telah dipatenkan yang berfungsi menentukan website mana yang lebih penting atau populer. PageRank merupakan salah satu feature utama mesin pencari Google dan diciptakan oleh pendirinya, Larry Page dan Sergey Brin.

Bagi Anda yang mengenal, memahami, dan menggunakan PageRank, dapat mendongkrak websitenya ke atas daftar hits. Namun, yang menyalah gunakannya akan dihukum. Namun bagaimana cara kerja PageRank dan kapan sebuah website berada di atas dalam daftar hits?


Cara kerja rumus dan formula PageRank
Di balik PageRank ada pemikiran yang sederhana sekaligus jenius:


1. Untuk setiap website ada sejumlah tertentu website lain yang menempatkan sebuah hyperlink ke website yang bersangkutan.
2. Setiap website memiliki sebuah PageRank.
3. Link dari website B ke website A dihitung sebagai satu suara dari B untuk A. Seperti dalam pemungutan suara.
4. Selain itu, PageRank website B memberi bobot suara untuk A. Semakin tinggi PageRank website B, semakin baik.
5. Faktor-faktor lainnya, berapa banyak link terdapat di website B. Semakin sedikit jumlahnya, semakin baik untuk PageRank website A.
6. Jumlah semua PageRank sama dengan jumlah semua dokumen di Internet. Jadi, PageRank adalah pembobotan sebuah dokumen di Internet secara keseluruhan yang tercatat.

PageRank dihitung untuk setiap website, bukan untuk seluruh tawaran website. Oleh karena itu, sebuah artikel tertentu di webserver bisa jadi mendapat PageRank lebih tinggi daripada websitenya sendiri.


Sebagai rumus seluruh algoritma PageRank tampak sebagai berikut:
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(TN))


Berikut penjelasan rumus diatas: PageRank website A adalah jumlah PageRank website T1 hingga Tn, masing-masing dibagi dengan jumlah link pada website yang bersangkutan. Selain itu, ada faktor peredam, sebuah elemen sangat penting yang selanjutnya masih akan berperan


KALKULASI PAGERANK – Empat website saling menghubungi melalui link. Tergantung jumlah link yang mengantar ke sebuah website, maka di dapat nilai PageRank tertentu (PR).

Prinsip PageRank dapat diperjelas. Anggaplah seluruh web hanya terdiri atas empat website A, B, C, dan D. Dalam contoh masing-masing memiliki nilai PageRank awal “1”. Jumlahnya sama dengan jumlah website. Dalam contoh pertama website B, C, dan D masing-masing memiliki sebuah link ke website A dan tidak ada link lainnya. Apabila faktor peredam diabaikan, hasilnya adalah rumus:


PR(A) = 1/1 + 1/1 + 1/1
PageRank website A adalah 3. Contoh yang lebih rumit (lihat halaman 199): Website A memiliki link ke website B dan C. B hanya memiliki sebuah link ke A. C memiliki link ke A, B, dan D. D hanya memiliki link ke B. 

Rumus untuk A akan menjadi:

PR(A) = 1/1 + 1/3
Link dari B bernilai 1, sementara dari C hanya 1/3 dengan jumlah links 3. Hasilnya adalah 1,33.


Untuk B:
PR(B) = 1/2 + 1/3 + 1/1
Dibulatkan hasilnya adalah 1,83.


Untuk C:
PR(C) = ½
Hasilnya 0,5.


Untuk D:
PR(D) = 1/3
Hasilnya dibulatkan 0,33.


Jumlah PageRank website A, B, C dan D seharusnya sama dengan jumlah website :
1,33 + 1,83 + 0,5 + 0,33 = 3,99

Kekurangan 0,1 disebabkan oleh pembulatan. Dalam kalkulasi ini masih ada yang kurang. PageRank setiap website tidak disertakan. Sekali lagi kita ambil contoh website B. Apabila kalkulasi disesuaikan dengan PageRank yang didapat dari langkah 


pertama:
PR(B) = 1/2 + 1/3 + 1/1

Didapat term berikut:
PR(B) = 1,33/2 + 0,5/3 + 0,33/1

Hasilnya dibulatkan adalah 1,62. Tentu saja kalkulasi baru PageRank website B mengubah PageRank website A, C, dan D. Nilai baru D kembali mengubah nilai B. Oleh karena itu, Google mendekati PageRank secara iteratif. Google mengambil hasil sebuah putaran untuk kalkulasi dalam langkah iterasi berikutnya. Menurut keterangan Page dan Brin, cukup 100 kali putaran iterasi untuk mencapai secara mendekati nilai PageRank dari milyaran website yang terdapat di Internet.

Faktor peredam: Menyertakan pengguna dalam kalkulasi
Berdasarkan asumsi Google, PageRank merepresentasikan kemungkinan seorang peselancar sampai ke sebuah website de­ngan mengklik sebuah link. Berhubung peselancar tidak mungkin meng-klik tanpa henti, maka ke dalam rumus di masukkan faktor peredam.

Bisa dikatakan, faktor peredam ini mensimulasikan peselancar kehilangan minat mengikuti link. Peredaman ini dikalkulasikan ke dalam jumlah voting me­lalui link ke website. Dalam penjelasan algo­ritmanya, Sergey Brin dan Larry Page mensyaratkan faktor peredaman 0,85. Bisa diasumsikan, dalam realita Google nilai tersebut memang berkisar pada 0,85.

Berbeda dengan contoh di atas, PageRank sebenarnya ditetapkan antara 0 dan 1 sebagai nilai prakiraan. Dari situ didapat pecahan desimal kecil yang menghasilkan PageRank sebuah website. Sebuah website dengan nilai 0,01 memiliki kemungkinan sebesar 1% mendapat kunjungan seorang pengguna ketika yang bersangkutan mengklik sebuah link secara kebetulan.

Namun, berikut ini masih teka-teki. Apabila PageRank dinyatakan sebagai angka antara 0 dan 1, mengapa pada toolbar Google (http://toolbar.google.com) nilainya ditampilkan antara 1 dan 10? Jawabannya, Google mengkonversinya. Bagaimana caranya, tidak jelas. Namun banyak pakar berpendapat, konversinya tidak linear, melainkan logaritmis. Artinya, lompatan PageRank dari 1 ke 2 pada toolbar jauh lebih mudah daripada dari 9 ke nilai terbaik 10.


Artikel Terkait:

Tidak ada komentar:

Related Posts Plugin for WordPress, Blogger...