WordNet

Apa itu WordNet?

Pembuatan kamus umumnya secara alphabetical dan tidak memperhatikan arti kata tersebut. Hal ini merupakan cara termudah bagi pembuat maupun pemakai kamus. Namun kekurangan dari sistem kamus ini adalah pencarian kata secara alphabetical adalah sesuatu yang membosankan dan memakan banyak waktu. Sehingga banyak orang menjadi malas untuk mencari kata di dalam kamus.

Seiring dengan perkembangan teknologi, masalah ini dapat diatasi. Salah satu cara adalah dengan kamus online komputer. Komputer dapat melakukan pencarian kata dalam waktu singkat, tetapi sistem yang dipakai tetap sistem kamus konvensional, sehinga komputer yang dipakai hanya sebagai media pencari kata. Hal ini sangat tidak efisien. Oleh karena itu, para ahli bahasa membuat sebuah terobosan kamus dengan sistem baru. WordNet adalah usulan untuk mengkombinasikan pemanfaatan komputer berkecepatan tinggi dengan informasi lexical tradisional secara lebih efektif.

Menurut George A. Miller, Richard Beckwith, Christiane Fellbaum, Derek Gross, dan Katherine Miller pada penilitiannya pada tahun 1993 yang berjudul Introduction to WordNet: An On-line Lexical Database menjelaskan bahwa WordNet merupakan suatu sistem referensi leksikal yang dibuat atas dasar teori psikolingustik tentang memori leksikal manusia.

WordNet secara umum memiliki arti sebuah lexical database yang sangat lengkap dan menangani open-class words dari sebuah bahasa alami. Untuk open-class words sendiri memiliki arti kata yang dapat termasuk ke dalam lebih dari satu kelas kata: noun (kata benda), verb (kata kerja), adjective (kata sifat) dan adverb (kata keterangan).

Di dalam WordNet, kata disimpan dalam bentuk sinonim set (synset). Synset adalah kata-kata yang memiliki bentuk kata yang berbeda tetapi arti kata tersebut sama. Tetapi WordNet lebih dari sekedar daftar kata yang memiliki arti kata yang sama. Synset-synset ini saling berhubungan dengan relasi-relasi yang berbeda. Perbedaan WordNet dengan thesaurus adalah relasi kata-kata ini. Namun dalam beberapa hal, WordNet menyerupai kamus tradisional. Sebagai contoh, WordNet memberikan definisi dan contoh kalimat pada hampir setiap synset. WordNet juga memiliki informasi morphology dari kata yang dimaksud.

Karakteristik
  • WordNet dapat digunakan secara bebas (public domain software).

  • WordNet juga bersifat open source. Database dan sumber code offline WordNet dapat diperoleh di http://wordnet.princeton.edu
Pemanfaatan

WordNet banyak dipakai dalam bidang Linguistik dan Natural Language Processing (Pemrosesan Bahasa Alami, disingkat NLP), khususnya Computational Linguistic.

Dalam bidang Linguistik, para pengalih bahasa sering kesusahan dalam menemukan padanan kata yang pas atau cocok dengan makna yang disajikan oleh bahasa aslinya. Padanan kata ini disajikan dengan baik menggunakan WordNet.

Dalam bidang NLP/CL sendiri WordNet banyak dipakai dalam semantic tagging, word sense disambiguation, information extraction, information retrieval, document classification and retrieval, dan lain-lain.

Berikut adalah contoh WordNet yang telah dicantumkan oleh Global WordNe Association yang cukup terkenal diantaranya:

  • Romanian WordNet
    Dan Tufis, Eduard Barbu, Verginica Barbu Mititelu, Radu Ion, Luigi Bozianu, Paper The Romanian WordNet, 2004.

  • Thai WordNet
    Sareewan Thoongsup, Kergrit Robkop, Chumpol Mokarat, Tan Sinthurarat, Thatsanee Charoenporn, Virach Sornlertlamvanich, Hitoshi Isahara, Thai WordNet Construction, 2009.