Friday, April 1, 2011

Analisis dari Web - Bab 4

Belajar sifat-sifat dari Web sebagai objek formal menyediakan cukup banyak pengaruh untuk desainer dari sistem baru, dan badan standar yang tugasnya adalah menemukan dan menjaga variasi dari pengalaman Web pada skala besar. Pada bagian ini kita akan meninjau secara singkat upaya untuk mendeskripsikan topologi web.

4.1              Topologi Web
4.1.1        Struktur Web
Investigasi topologi dilakukan untuk  memahami bentuk dasar dari arsitektur dan relasi diantara keduanya. Struktur dapat memberi kita banyak informasi. Penyelidikan struktur dari web selalu tergantung dari level pemisahan dari pendeskripsian struktur web. Seperti contohnya saja ukuran web yang mungkin memiliki perbedaan sangat kecil dalam kinerja dari komponennya mampu memberikan perbedaan besar di level makro.

Pemahaman struktur sangat penting untuk sejumlah aplikasi, seperti navigasi, pencarian, menyediakan sumber daya untuk mendukung komunitas online, atau efek dari perubahan mendadak dalam permintaan informasi.

Topologi Web berisi kompleksitas dari rantai linear sederhana. Pada bagian ini, kita akan membahas upaya untuk mengukur struktur global dari Web, dan bagaimana halaman web individu dapat masuk ke dalam konteks itu.

4.1.2        Penelitian teoritis graph
Mungkin paradigma yang paling terkenal untuk mempelajari Web adalah teori grafik. Web dapat dilihat sebagai grafik yang besar pada tengah halaman dan bagian tepinya adalah link. Karena weblinks sangat sedikit berantakan, jelas bahwa tepi grafik mengkodekan banyak struktur yang terlihat oleh desainer dan penulis konten yang bagi mereka adalah sama pentingnya.

Konektivitas webgraph telah dianalisis secara rinci, menggunakan struktural seperti indikator seperti bagaimana node yang terhubung. Berbagai makro struktur scopic telah dilihat dan diukur, misalnya satu merangkak dari lebih dari 200 juta halaman menemukan bahwa 90% dari Web sebenarnya tersambung. Struktur berikutnya sering disebut sebagai bentuk bowtie, seperti yang ditunjukkan pada Gambar di bawah. Simpul dasi sangat berhubungan cluster (SCC) dari webgraph di mana terdapat jalur antara setiap pasangan node. SCC ini diapit oleh dua set cluster, mereka yang dihubungkan (link) ke SCC tetapi dari yang tidak ada backlink (ditandai sebagai DI dalam gambar), dan mereka yang terkait dari SCC tetapi tidak link kembali (OUT). Hubungan antara SCC, IN dan OUT memberikan bentuk bowtie. Implikasi dari penemuan ini masih topologi perlu dipahami. Meskipun beberapa telah mengusulkan perubahan terhadap algoritma PageRank untuk mengambil keuntungan dari topologi dasar, masih ada banyak pekerjaan yang harus dilakukan untuk mengeksploitasi struktur terlihat.

  



Struktur bowtie lazim di berbagai skala. Dill di al telah menemukan bahwa himpunan bagian yang lebih kecil dari Web juga memiliki bentuk bowtie, sebuah petunjuk bahwa Web mempunyai sifat fractal yang menarik karakteristik sebagai Web pada umumnya.

Memang, pertanyaan skala dipotong dua arah. Ada yang lain, lebih kecil dari Web sekitar, dan web itu sendiri datang sebagai sesuatu dari kejutan bagi matematikawan dan ilmuwan komputer pada saat itu dimulai, sekarang studi Web cenderung melihat Web. Struktur tersebut sebagai Intranets mempunyai sifat yang sangat berbeda, dalam hal ukuran, konektivitas, koherensi dan pencarian sifat; beberapa sifat terbawa dari Internet secara keseluruhan, sementara yang lainnya tidak. Telah ada sedikit pekerjaan atas struktur kontras, meskipun melihat untuk investigasi Intranet, dan subgraphs sesuai dengan topik scientific tertentu . Web cukup jarang tersambung, berarti bahwa subgraph disebabkan oleh satu set acak node akan hampir kosong, tetapi jika kita mencari kelompok non-acak (cluster tematis-bersatu atau TUCs) yang jauh lebih dihubungkan, maka kita melihat bentuk bowtie muncul lagi. Setiap TUC akan memiliki SCC sendiri, dan sendiri IN dan OUT sisi, termuat di dalam SCC yang lebih luas. SCC skala yang lebih besar, karena sangat berhubungan, kemudian dapat bertindak sebagai tulang punggung navigasi antara TUCs.

4.2              Matematik dalam Web
Opez L 'Ortiz, dalam surveinya, terlihat di sejumlah paradigma berguna untuk memahami dasar-dasar algoritmik Internet pada umumnya dan Web pada khususnya. Menerapkan wawasan tentang algoritma masalah jaringan, dalam konteks protokol tertentu mendasari Web, berpotensi sangat bermanfaat. Pertumbuhan dari Web, seperti Opez L ‘Ortiz tunjukkan, adalah yang paling canggih dari teks algoritma pengindeksan yang beroperasi baik di dalam zona kenyamanan mereka dalam aplikasi standar pada awal tahun 1995, namun berjuang keras pada akhir tahun itu.

4.2.1        Model rasional
Salah satu paradigma penting adalah bahwa dari ekonomi mikro, mathemat diskrit
ics, teori pilihan rasional dan teori permainan. Meskipun pengguna individu mungkin atau mungkin tidak "rasional", itu telah lama mencatat bahwa secara masal orang berperilaku sebagai maximisers utilitas. Dalam hal ini, pemahaman insentif yang tersedia bagi pengguna Web harus menyediakan metode untuk model menghasilkan perilaku, dan karenanya pandangan tentang apa global set perilaku yang diinginkan bisa direkayasa, dan apa yang bisa system mendukung perilaku tersebut.



Jika, seperti dalam Gambar di atas, kurva penawaran adalah elastis sempurna (misalnya horizontal), ada tiga kesetimbangan: dua titik di mana suplai persilangan kurva kurva permintaan (pada jaringan ukuran B dan C), dan titik di mana kurva penawaran hits sumbu y (A = 0). Jika jaringan ukuran tetap pada 0, maka permintaan tetap nihil, dan kami tinggal di posisi A. Pada C, posisi ini juga stabil; jaringan berisi semua customers siap untuk membayar tarif pasar, dan tidak bisa tumbuh karena ada tidak ada orang lain siap untuk membayar. Jika jaringan tumbuh, itu harus karena harga telah jatuh (yaitu kurva penawaran telah bergerak ke bawah; jika menyusut jaringan, yang harus karena seseorang telah mengubah preferensi dan sekarang tidak lagi siap untuk membayar harga pasar (yaitu kurva permintaan telah bergerak ke bawah). Jika kita berasumsi bahwa dua kurva tetap diam, maka setiap perubahan akan mengakibatkan slip kembali ke C. Kuncinya adalah B, yang meskipun suatu kesetimbangan tidak stabil. Jika ukuran jaringan tergelincir di bawah B, maka tidak cukup banyak orang akan siap untuk membayar tingkat pasar dan permintaan secara bertahap akan tergelincir kembali ke nol. Jika di sisi lain bisa mendapatkan dari B, maka tiba-tiba banyak lebih banyak konsumen akan muncul yang siap untuk membayar harga pasar atau lebih, dan ukuran jaringan akan meningkat secara dramatis, mendapatkan lebih dari punuk kurva permintaan dan mencapai C. Jadi B adalah massa kritis untuk jaringan.

4.2.2        Model Pencarian Keterangan
Sebuah paradigma penting kedua adalah bahwa pencarian informasi. IR adalah fokus untuk perlombaan senjata antara algoritma untuk mengekstrak informasi dari repositori yang kedua repositori mendapatkan lebih besar dan lebih kompleks, dan tuntutan pengguna lebih sulit untuk memuaskan (baik dalam hal respon waktu atau kompleksitas dari query).

Mungkin lebih tepatnya, IR tradisional telah digunakan di jinak lingkungan di mana massa data ditambang untuk nugget akal; masalah khas adalah kompleksitas dan kurangnya pola. Benchmark koleksi dokumen bagi para peneliti IR cenderung berkualitas tinggi dan hampir tidak pernah sengaja menyesatkan, seperti koleksi ilmiah makalah dalam jurnal khusus. Web-lain seperti mini-struktur yang dapat digunakan, seperti Intranet, juga ditandai dengan itikad baik dengan informasi yang disajikan. Namun upaya berbahaya untuk menumbangkan sangat IR sistem yang theWeb dukungan baik yang semakin umum. IR berbasis web harus menghadapi tidak hanya skala dan kompleksitas informasi, tetapi upaya potensi untuk condong hasilnya dengan konten dimaksudkan  ntuk menyesatkan.

4.2.3        Struktur Berbasis Pencarian
Hasil IR yang benar-benar dibawa ke dalam usia pencarian Web adalah penemuan bahwa adalah mungkin untuk membuat perbedaan heuristik antara link tersebut yang muncul untuk menunjukkan kualitas terkait-ke situs, dan mereka yang tidak, hanya berdasarkan perhitungan nilai eigen matriks yang berhubungan dengan struktur link subgraphs lokal. Juga tidak HITS algoritma juga tidak Kleinberg Page et al PageRank dibutuhkan dalam lain masukan dari struktur dinyatakan uninterpreted dari hyperlink ke dan dari halaman Web.

Search engine juga harus berjuang untuk tetap saat ini, oleh Mengindeks ulang sesering mungkin, konsisten dengan menekan biaya, sebagai Web tumbuh dan halaman individu diedit atau diubah sebagai database mendasari mereka mengubah. Search engine dapat dibandingkan dengan menggunakan berbagai parameter, baik itu liputan mereka (jumlah hits kembali query yang diberikan, terutama melihat jumlah hits hanya dicapai oleh mesin pencari), relevansi dari halaman kembali; waktu diambil, atau kualitas kembali. Sebagai salah satu harapkan, mesin yang berbeda melakukannya dengan baik pada metrik yang berbeda.

4.2.4        Metode Matematika untuk Menggambarkan Struktur
Memahami matematika dan topologi dari Web adalah praktis impor untuk memahami invariants dari pengalaman Web dan Oleh karena itu menyediakan peta jalan untuk ekstensi untuk theWeb. Yang penting properti yang memiliki Web adalah ketahanan dalam menghadapi pengaruh undermining; baik hacker maupun kesalahan yang tak terelakkan dalam fisik jaringan sangat mengganggu theWeb, meskipun sesuatu seperti satu router dalam empat puluh turun di setiap saat satu. ASI Barab dan kolega advokasi.

Di sisi lain, teori perkolasi menunjukkan bahwa skala bebas karya agak lebih rentan terhadap terarah, serangan terkoordinasi, bahkan jika mereka tahan terhadap kegagalan acak. Non-acak kegagalan bisa merusak jika mereka menargetkan situs yang sangat terhubung, kegagalan sejumlah kecil hub secara dramatis dapat meningkatkan diameter Web (dalam hal jumlah terkecil klik diperlukan untuk pergi dari satu halaman yang dipilih secara acak lain), dan kegagalan dari sejumlah besar situs yang sangat-tersambung bisa menyebabkan fragmentasi.

4.2.5        Metode Matematika untuk Menggambarkan Layanan
Sebagai Web berkembang untuk memasukkan model layanan, di mana perangkat lunak agen dan layanan Web akan hidup online dan dipanggil oleh pengguna, dan di mana metafora yang semakin penting adalah bahwa klien menghubungi penyedia layanan, representasi matematika baru, formalisms dan teori menjadi berguna untuk menggambarkan hubungan ini.

Ada kebutuhan untuk bahasa untuk menggambarkan layanan web (seperti CDL atau BPEL), dan mungkin bahwa matematika yang tercantum di sini bisa mendukung bahasa tersebut. Ada hidup perdebatan tentang jala Petri dan π-kalkulus, berfokus pada manfaat relatif dari, jaring negara berbasis grafis, dan semakin tekstual, linier, aljabar event.

Bentuk dari PPT bisa didownload di sini:
 
 Atau bisa klik di sini untuk melihat gambar :

0 comments:

Post a Comment