posted by: Dunia Andromeda
Bertahun
tahun google pagerank telah menjadi sebuah rahasia besar di dunia maya
dimana banyak orang berlomba lomba untuk memecahkan misteri tersebut.
Dan saat ini rahasia besar tersebut telah terungkap ke publik.
Mari kita mulai dengan beberapa logika berikut ini. Internet sangat
besar, sebaliknya website sangat kecil. Tidak heran, apabila sebuah
website sangat sulit untuk menonjolkan diri dan bersaing dengan milyaran
website serupa untuk menampakkan dirinya kepada seluruh pengakses
Internet.
Pengguna hanya bisa melihat suatu website apabila ia menjalankan
pencarian di Google dan website tersebut berada paling atas dalam daftar
hits. Hanya saja, apabila ada ratusan website serupa di Internet, yang
mana yang akan tampil paling atas atau paling bawah dalam daftar hits?
Jawabannya dituangkan ke dalam sebuah rumus algoritma PageRank.
Seperti
kita ketahui, PageRank adalah sebuah algoritma yang telah dipatenkan
yang berfungsi menentukan website mana yang lebih penting atau populer.
PageRank merupakan salah satu feature utama mesin pencari Google dan
diciptakan oleh pendirinya, Larry Page dan Sergey Brin.
Bagi Anda yang mengenal, memahami, dan menggunakan PageRank, dapat
mendongkrak websitenya ke atas daftar hits. Namun, yang menyalah
gunakannya akan dihukum. Namun bagaimana cara kerja PageRank dan kapan
sebuah website berada di atas dalam daftar hits?
Cara kerja rumus dan formula PageRank
Di balik PageRank ada pemikiran yang sederhana sekaligus jenius:
1. Untuk setiap website ada sejumlah tertentu website lain yang menempatkan sebuah hyperlink ke website yang bersangkutan.
2. Setiap website memiliki sebuah PageRank.
3. Link dari website B ke website A dihitung sebagai satu suara dari B untuk A. Seperti dalam pemungutan suara.
4. Selain itu, PageRank website B memberi bobot suara untuk A. Semakin tinggi PageRank website B, semakin baik.
5. Faktor-faktor lainnya, berapa banyak link terdapat di website B.
Semakin sedikit jumlahnya, semakin baik untuk PageRank website A.
6. Jumlah semua PageRank sama dengan jumlah semua dokumen di Internet.
Jadi, PageRank adalah pembobotan sebuah dokumen di Internet secara
keseluruhan yang tercatat.
PageRank dihitung untuk setiap website, bukan untuk seluruh tawaran
website. Oleh karena itu, sebuah artikel tertentu di webserver bisa jadi
mendapat PageRank lebih tinggi daripada websitenya sendiri.
Sebagai rumus seluruh algoritma PageRank tampak sebagai berikut:
PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(TN))
Berikut penjelasan rumus diatas: PageRank website A adalah jumlah
PageRank website T1 hingga Tn, masing-masing dibagi dengan jumlah link
pada website yang bersangkutan. Selain itu, ada faktor peredam, sebuah
elemen sangat penting yang selanjutnya masih akan berperan
KALKULASI PAGERANK – Empat website saling menghubungi melalui link.
Tergantung jumlah link yang mengantar ke sebuah website, maka di dapat
nilai PageRank tertentu (PR).
Prinsip PageRank dapat diperjelas. Anggaplah seluruh web hanya
terdiri atas empat website A, B, C, dan D. Dalam contoh masing-masing
memiliki nilai PageRank awal “1”. Jumlahnya sama dengan jumlah website.
Dalam contoh pertama website B, C, dan D masing-masing memiliki sebuah
link ke website A dan tidak ada link lainnya. Apabila faktor peredam
diabaikan, hasilnya adalah rumus:
PR(A) = 1/1 + 1/1 + 1/1
PageRank website A adalah 3. Contoh yang lebih rumit (lihat halaman
199): Website A memiliki link ke website B dan C. B hanya memiliki
sebuah link ke A. C memiliki link ke A, B, dan D. D hanya memiliki link
ke B.
Rumus untuk A akan menjadi:
PR(A) = 1/1 + 1/3
Link dari B bernilai 1, sementara dari C hanya 1/3 dengan jumlah links 3. Hasilnya adalah 1,33.
Untuk B:
PR(B) = 1/2 + 1/3 + 1/1
Dibulatkan hasilnya adalah 1,83.
Untuk C:
PR(C) = ½
Hasilnya 0,5.
Untuk D:
PR(D) = 1/3
Hasilnya dibulatkan 0,33.
Jumlah PageRank website A, B, C dan D seharusnya sama dengan jumlah website :
1,33 + 1,83 + 0,5 + 0,33 = 3,99
Kekurangan 0,1 disebabkan oleh pembulatan. Dalam kalkulasi ini masih
ada yang kurang. PageRank setiap website tidak disertakan. Sekali lagi
kita ambil contoh website B. Apabila kalkulasi disesuaikan dengan
PageRank yang didapat dari langkah
pertama:
PR(B) = 1/2 + 1/3 + 1/1
Didapat term berikut:
PR(B) = 1,33/2 + 0,5/3 + 0,33/1
Hasilnya dibulatkan adalah 1,62. Tentu saja kalkulasi baru PageRank
website B mengubah PageRank website A, C, dan D. Nilai baru D kembali
mengubah nilai B. Oleh karena itu, Google mendekati PageRank secara
iteratif. Google mengambil hasil sebuah putaran untuk kalkulasi dalam
langkah iterasi berikutnya. Menurut keterangan Page dan Brin, cukup 100
kali putaran iterasi untuk mencapai secara mendekati nilai PageRank dari
milyaran website yang terdapat di Internet.
Faktor peredam: Menyertakan pengguna dalam kalkulasi
Berdasarkan asumsi Google, PageRank merepresentasikan kemungkinan
seorang peselancar sampai ke sebuah website dengan mengklik sebuah
link. Berhubung peselancar tidak mungkin meng-klik tanpa henti, maka ke
dalam rumus di masukkan faktor peredam.
Bisa dikatakan, faktor peredam ini mensimulasikan peselancar
kehilangan minat mengikuti link. Peredaman ini dikalkulasikan ke dalam
jumlah voting melalui link ke website. Dalam penjelasan algoritmanya,
Sergey Brin dan Larry Page mensyaratkan faktor peredaman 0,85. Bisa
diasumsikan, dalam realita Google nilai tersebut memang berkisar pada
0,85.
Berbeda dengan contoh di atas, PageRank sebenarnya ditetapkan antara 0
dan 1 sebagai nilai prakiraan. Dari situ didapat pecahan desimal kecil
yang menghasilkan PageRank sebuah website. Sebuah website dengan nilai
0,01 memiliki kemungkinan sebesar 1% mendapat kunjungan seorang pengguna
ketika yang bersangkutan mengklik sebuah link secara kebetulan.
Namun, berikut ini masih teka-teki. Apabila PageRank dinyatakan sebagai angka antara 0 dan 1, mengapa pada toolbar Google (http://toolbar.google.com)
nilainya ditampilkan antara 1 dan 10? Jawabannya, Google
mengkonversinya. Bagaimana caranya, tidak jelas. Namun banyak pakar
berpendapat, konversinya tidak linear, melainkan logaritmis. Artinya,
lompatan PageRank dari 1 ke 2 pada toolbar jauh lebih mudah daripada
dari 9 ke nilai terbaik 10.
Tidak ada komentar:
Posting Komentar