Halaman

Sabtu, 17 November 2012


Tugas Mata Kuliah
”INFORMASI RETRIVAL”
Dosen Pembimbing : Ratrie Enggar Pawening,S.Kom


 
 Nama : Lindawati
Nim : 10011706
Kelas : B
 

SEKOLAH TINGGI TEKNOLOGI NURUL JADID PAITON PROBOLINGGO
TAHUN AKADEMIK 2012

 
A. STANDART TEST COLLECTION  
koleksi uji Standard adalah membahas alasan untuk menggunakan penilaian relevansi biner dan alternatif Banyak sistem mengandung bobot berbagai (sering dikenal sebagai parameter) yang dapat disesuaikan untuk menyempurnakan kinerja sistem. Adalah salah untuk melaporkan hasil pada koleksi uji yang diperoleh dengan tuning parameter untuk memaksimalkan kinerja pada koleksi yang. Itu karena melebih-lebihkan tala tersebut kinerja yang diharapkan dari sistem, karena bobot akan diatur memaksimalkan kinerja pada satu set tertentu dari query bukan untuk acak sampel pertanyaan. Dalam kasus tersebut, prosedur yang benar adalah memiliki satu atau koleksi lainnya pengembangan tes, dan untuk menyempurnakan UJI parameter PENGEMBANGAN pada devel-KOLEKSI opment tes koleksi. Tester kemudian menjalankan sistem dengan orang-bobot pada pengumpulan pengujian dan laporan hasil pada koleksi yang objektif sebagaiperkiraankinerja.
     1. TREC
  • Pengertian
          Treck /Teks pencarian Konferensi adalah sebuah sebuah serial yang sedang berlangsung lokakarya berfokus pada daftar informasi daerah yang berbeda penelitian pengambilan (IR), atau trek.Dimana track ini mulai digunakan pada tahun 1992
              Tujuan dari mempelajari trec adalah:

  • Dapat memberikan hasil penelitian  yang lebih baik
  • Penilaian lengkap tidak mungkin
  • Kita dapatmenggunakan pooling untuk mengatas iini
  • Metodologi yang dapat digunakan untuk banyak tugas
  • Pengambilan adalah hanya awal filtering, pencarian Web, pidato, video pengambilan
        Perkembangannya :
The US National Institute of Standar dan Teknologi (NIST) telah menjalankan serangkaian tes besar IR tidur evaluasi sejak tahun 1992. Dalam kerangka ini, ada trek selama bertahun berbagai koleksi uji beda, tetapi koleksi terbaik pengujian diketahui adalah yang digunakan untuk melacak Trec Ad Hoc selama 8 evaluasi pertama Trec antara tahun 1992 dan 1999. Secara total, ini koleksi pengujian terdiri dari 6 CD yang mengandung 1,89 juta dokumen (terutama, tetapi tidak eksklusif, newswire artikel) dan penilaian relevansi untuk 450 kebutuhan informasi, yang disebut topik dan ditetapkan dalam bagian teks rinci. Koleksi uji individu didefinisikan lebih himpunan bagian yang berbeda dari data ini. Para TRECs awal setiap terdiri dari 50 kebutuhan informasi, dievaluasi lebih set berbeda tetapi tumpang tindih dokumen. TRECs 6-8 menyediakan 150 kebutuhan informasi selama sekitar 528,000 Newswire dan artikel Informasi Broadcast Dinas Luar Negeri. Ini mungkin adalah subcollection terbaik untuk digunakan dalam pekerjaan di masa depan, karena itu adalah terbesar dan topik yang lebih konsisten. Karena koleksi pengujian dokumen yang begitu besar, tidak ada penilaian relevansi lengkap. Sebaliknya, penilaian relevansi NIST asesor hanya tersedia untuk dokumen yang berada di antara $ k atas $ kembali untuk beberapa sistem yang masuk dalam evaluasi Trec yang kebutuhan informasi dikembangkan.Dalam tahun-tahun terakhir, NIST telah melakukan evaluasi pada koleksi dokumen yang lebih besar, termasuk koleksi 25 juta halaman GOV2 halaman web. Sejak awal, koleksi uji dokumen NIST adalah lipat lebih besar daripada apa yang tersedia untuk peneliti sebelumnya dan GOV2 sekarang koleksi Web terbesar mudah tersedia untuk tujuan penelitian. Namun demikian, ukuran GOV2 masih lebih dari 2 lipat lebih kecil dari ukuran saat ini koleksi dokumen yang diindeks oleh perusahaan pencarian web yang besar.

  • Ilustrasi Gambar

  • Contoh Kasus    
<top>
<num> Nomor: 161
<title> Bali Wisata terindah
<desc> Keterangan:
Informasi apa yang tersedia pada wisata indah di pulau bali, indonesia?
<narr> Narasi:
Setiap dokumen yang membahas wisata terindah di
di pulau bali, Indonesia dianggap
yang relevan. Dokumen membahas bali wisata di
malaysia tidak relevan.
</ top>

    2. REUTERS 
Reuters Saat ini yang paling banyak digunakan untuk penelitian uji koleksi teks kategorisasi, meskipun mungkin diganti selama beberapa tahun berikutnya dengan RCV1. Data awalnya dikumpulkan dan diberi label oleh Carnegie Group, Inc, dan Reuters, Ltd dalam rangka mengembangkan sistem menafsirkan teks kategorisasi. Rincian lebih lanjut, termasuk pembahasan versi sebelumnya dari koleksi (misalnya Reuters-22173), tersedia dalam file README.

Koleksi ini tersedia di sini sebagai arsip tar gzip (8.2 MB, 28,0 MB terkompresi). The UCI KDD arsip juga memiliki entri untuk koleksi, termasuk salinan. Versi di UCI identik, dan saya mendorong Anda untuk mendapatkan copy UCI jika tersedia untuk menghemat bandwidth di situs ini. Lokasi sebelumnya koleksi (sekarang sudah tidak aktif lagi) adalah http://www.research.att.com/ ~ lewis/reuters21578.html dan ftp:://canberra.cs.umass.edu/pub/reuters.


Berbagai peneliti telah mempersiapkan file data yang berguna untuk bekerja dengan Reuters-21.578. Hubungi saya jika Anda ingin saya untuk menjadi tuan rumah sumber daya seperti di sini, saya senang jika disk mereka kebutuhan ruang yang sederhana. Saat ini satu-satunya sumber tersebut tersedia di sini adalah fakta PROLOG dasar tentang negara disumbangkan oleh Ronen Feldman.


  • contoh kasus
Elan Microelectronics Corp (EMC), sebuah perusahaan touch design yang bermarkas di Taiwan, pada Kamis kemarin (5 Jan) mengatakan bahwa Apple akan membayar US$5 juta sebagai bagian dari sebuah kesepakatan dalam kasus pelanggaran hak paten.

Apa yang disampaikan EMC juga menyebut bahwa dua perusahaan yang terlibat kasus paten itu akan bertukar kewenangan untuk memakai paten masing-masing.

Di tahun 2009, EMC menggugat Apple di pengadilan Amerika atas pelanggaran dua paten. Di tahun yang sama Apple ganti menggugat EMC.

Komisi Perdagangan Internasional Amerika (ITC) selanjutnya pada bulan Juni 2009 memutuskan bahwa Apple tidak bersalah karena tidak melanggar hukum perdagangan Amerika.

Selain dengan EMC, Apple juga masih dalam perang paten dan saling gugat dengan perusahaan lain. Yang terpanas pastinya perseteruan Apple kontra Samsung terkait paten iPhone/iPad dan smartphone/tablet Galaxy Series.

Laporan Reuters menyebut bahwa perang paten telah menjadi hal yang lumrah di dunia teknologi karena produsen pastinya ingin melindungi teknologi yang ada di produk mereka sehingga tidak dipakai oleh pesaingnya. Tapi dari semua kasus paten yang pernah ada, sebagian besar bisa diselesaikan di luar pengadilan karena perusahaan besar lebih suka menghindari pertarungan panjang di meja hijau. Sementara persidangan terus berlangsung, bisa jadi teknologi yang diperebutkan telah ketinggalan jaman karena munculnya teknologi lain yang lebih baru.

    3. CLEF
  • Pengertian
Adalah sebuah organisasi yang mempromosikan penelitian di multibahasa akses informasi (saat ini berfokus pada bahasa-bahasa Eropa ). Fungsi khusus adalah untuk mempertahankan kerangka dasar untuk menguji pencarian informasi sistem, dan menciptakan repositori data bagi para peneliti untuk digunakan dalam mengembangkan dibandingkan standar . Organisasi memegang sebuah forum pertemuan setiap September di Eropa. Sebelum setiap forum, peserta menerima satu set tugas tantangan. Tugas ini dirancang untuk menguji berbagai aspek sistem pencarian informasi dan mendorong perkembangan mereka.Inisiatif CLEF (Konferensi dan Labs dari Forum Evaluasi, CLEF mempromosikan penelitian dan pengembangan dengan menyediakan infrastruktur untuk:
  •  multibahasa dan pengujian sistem multimodal, tuning dan evaluas
  • penyelidikan penggunaan terstruktur, semi-terstruktur, yang sangat terstruktur, dan data semantik diperkaya dengan akses informasi;
  • penciptaan koleksi tes dapat digunakan kembali untuk pembandingan
  •  eksplorasi metodologi evaluasi baru dan cara-cara inovatif untuk menggunakan data eksperimen;
Saat ini yang paling banyak digunakan untuk penelitian uji koleksi teks kategorisasi, meskipun mungkin diganti selama beberapa tahun berikutnya dengan RCV1. Data awalnya dikumpulkan dan diberi label oleh Carnegie Group, Inc, dan Reuters, Ltd dalam rangka mengembangkan sistem menafsirkan teks kategorisasi. Rincian lebih lanjut, termasuk pembahasan versi sebelumnya dari koleksi (misalnya Reuters-22173), tersedia dalam file README.

Koleksi ini tersedia di sini sebagai arsip tar gzip (8.2 MB, 28,0 MB terkompresi). The UCI KDD arsip juga memiliki entri untuk koleksi, termasuk salinan. Versi di UCI identik, dan saya mendorong Anda untuk mendapatkan copy UCI jika tersedia untuk menghemat bandwidth di situs ini. Lokasi sebelumnya koleksi (sekarang sudah tidak aktif lagi) adalah http://www.research.att.com/ ~ lewis/reuters21578.html dan ftp:://canberra.cs.umass.edu/pub/reuters.


Berbagai peneliti telah mempersiapkan file data yang berguna untuk bekerja dengan Reuters-21.578. Hubungi saya jika Anda ingin saya untuk menjadi tuan rumah sumber daya seperti di sini, saya senang jika disk mereka kebutuhan ruang yang sederhana. Saat ini satu-satunya sumber tersebut tersedia di sini adalah fakta PROLOG dasar tentang negara disumbangkan oleh Ronen Feldman.

  • Contoh kasus

   Sidang terbuka atas terdakwa kasus ecstasy Muhamad Said, kembali digelar di Pengadilan Negeri Amsterdam Kamis (27/3). Dalam sidang yan dipimpin Hakim Ketua A van der Perk, Jaksa Penuntut Umum A Mooy kembali menyatakan bahwa Said merupakan anggota sindikat kriminal yang memperdagangkan obat-obat terlarang dengan daerah operasi Amsterdam, Rotterdam, dan Eindhoven.Jaksa juga mengatakan bahwa Said yang merupakan kapten pilot Garuda Indonesia telah melanggar opium wet (hukum Belanda yang berkaitan dengan obat-obat terlarang), karena dengan sengaja berupaya menyelundupkan ribuan pil ecstasy dari Amsterdam ke Jakarta pada 29 September 1996. Sidang terbuka kali ini yang berlangsung cukup panjang, yakni sekitar 12 jam, adalah yang kedua kali setelah yang pertama berlangsung tanggal 9 Januari 1997.
Menurut pembantu Kompas di Belanda, Bob Mantiri, persidangan hari itu memasuki tahapan pengujian materi dengan menghadirkan beberapa saksi penting atas permintaan tim penasihat hukum Said. Seperti sebelumnya, said didampingi tim penasihat hukumnya, Nicolaas Meijering, Leon van Cleef (dari Belanda), serta OC Kaligis dan Ritasari Suwandi (dari Indonesia).
Rita Suwandi yang dihubungi Kompas per telepon Jumat kemarin menambahkan, dalam sidang tersebut jaksa kembali menegaskan bahwa dalam kasus ini tidak ada keterkaitan pihak Kedutaan Besar Republik Indonesia (KBRI) di Belanda.
Karena itu, ketika pihaknya meminta berkas-berkas Peristiwa Zevenaar yang menurut Kepala Tim Unit 7 Antinarkotika Kepolisian Amsterdam Olierook ada keterlibatan KBRI dalam penyelundupan ecstasy yang dilakukan Said, jaksa Mooy menolaknya. "Ia menyatakan bahwa Peristiwa Zevenaar itu tidak ada kaitannya dengan Said. KBRI di Belanda pun tidak terlibat dalam kasus ini, karena itu ia tidak perlu memberi berkas-berkas peristiwa dimaksud," demikian penegasan jaksa sebagaimana diutarakan Rita.
 
Penjelasan saksi
   
   Menurut Rita, sidang yang menghadirkan saksi Dirk van Tijlingen (dari Tim Reserse Kepolisian Amsterdam) dan Olierook, berlangsung cukup menarik. Setidaknya dalam sidang yang mulai berlangsung pukul 10.00 hingga 21.40 waktu setempat, pihak penasihat hukum bisa mempersilangkan keterangan Olierook sebagaimana yang pernah diungkapkannya pada persidangan tertutup sebelumnya.
   Sebagai contoh Rita menyatakan, penasihat hukum meminta penjelasan  Olierook tentang keterlibatan Said dalam Peristiwa Zevenaar, Olierook ternyata tidak bisa berkata banyak. "Ia hanya berucap bahwa informasi tentang itu ia dapatkan dari rekannya di kepolisian juga, tapi ia memiliki berkas-berkasnya," kata Rita.
   Ketika didesak apakah ia sudah mempelajari dengan baik apa yang disebut dengan Peristiwa Zevenaar itu, Olierook kembali menyatakan belum. "Itu menunjukkan bahwa dia telah melakukan suatu kecerobohan," tandas Rita.
   Kehadiran van Tijlingen sendiri, menurut Rita, untuk "mengoreksi" keterangan dari informan 1500 (istilah untuk salah seorang informan kepolisian setempat). Menurut Tijlingen, kata Rita, informasi yang dimiliki pihak kepolisian "yang beragam" dibuat oleh informan 1500 tersebut. Dalam arti, ada beberapa keterangan yang disebut polisi terkait merupakan keterangan dari dua orang yang berbeda, tetapi sesungguhnya dibuat oleh informan 1500 itu saja.
  Dalam sidang tertutup sebelumnya, lanjut Rita, pihaknya memang sempat mengajukan sejumlah pertanyaan kepada informan 1500, namun hal itu hanya diperkenankan berlangsung melalui telepon. Alasan yang digunakan hakim pemeriksa adalah, jiwa informan 1500 itu terancam, sehingga tidak diperkenankan untuk dipertemukan secara langsung. "Kita juga mengajukan keberatan tentang hal ini kepada hakim di sidang kemarin," tambahnya.
   Pada sidang terbuka Kamis itu, tim penasihat hukum Said kembali meminta agar kliennya dikenakan tahanan luar dengan suatu jaminan.Namun, Jaksa Mooy kembali menyatakan keberatan dengan pertimbangan, Said merupakan kapten pilot Garuda yang sepatutnya bertanggung jawab terhadap seluruh penumpangnya. Sedangkan majelis hakim belum bisamemberi jawaban. "Hal ini masih dipertimbangkan," tutur hakim seperti diungkapkan Rita.
    Rencananya sidang akan dilanjutkan 23 April mendatang. Penasihat hukum Said juga sudah meminta agar adik Said yang bernama Ali Said dihadirkan sebagai saksi. (fan)