Academia.eduAcademia.edu

PROSIDING SEMINAR LEKSIKOGRAFI INDONESIA 2016

Here is our conference paper on Indonesia Lexicography Seminar held by the Indonesian Language of the Language Center. Our paper tells about dictionary evaluation, especially Dictionary of Using Language (Kamus Bahasa Using), one of Javanese dialect in East Java . You can read more detail our explanation on tittle paper:Evaluasi Kamus Bilingual Kamus Bahasa Daerah Using-Indonesia sebagai Upaya Pemertahanan Eksistensi Bahasa Using di Kabupaten Banyuwangi.

PROSIDING SEMINAR LEKSIKOGRAFI INDONESIA PROSIDING SEMINAR LEKSIKOGRAFI INDONESIA TANTANGAN LEKSIKOGRAFIS BAHASA-BAHASA DAERAH DI INDONESIA 26—29 Juli 2016 Hotel Santika, Taman Mini Indonesia Indah, Jakarta Pusat Pengembangan dan Pelindungan Badan Pengembangan dan Pembinaan Bahasa Kementerian Pendidikan dan Kebudayaan COV PROSIDING.indd 1 8/2/16 11:23 AM PROSIDING INI BELUM DISUNTING PROSIDING SEMINAR LEKSIKOGRAFI INDONESIA 26—29 Juli 2016 Hotel Santika, Taman Mini Indonesia Indah, Jakarta TANTANGAN LEKSIKOGRAFIS BAHASA-BAHASA DAERAH DI INDONESIA BADAN PENGEMBANGAN DAN PEMBINAAN BAHASA KEMENTERIAN PENDIDIKAN DAN KEBUDAYAAN JAKARTA 2016 PROSIDING HAL i.indd 1 8/2/16 2:06 PM MILIK NEGARA TIDAK DIPERDAGANGKAN Hak Cipta 2016 milik Kementerian Pendidikan dan Kebudayaan Dilindungi Undang-Undang Desain Sampul dan Tata Letak Yudi Nur Riyadi KATALOG DALAM TERBITAN (KDT) PB 413.028.06 PRO P Prosiding Seminar Leksilograi: Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia. Jakarta: Badan Pengembangan dan Pembinaan Bahasa, 2016. ISBN 978-979-069-211-4 LEKSIKOGRAFI-TEMU ILMIAH ii Prosiding Seminar Leksikograi Indonesia PROSIDING HAL i.indd 2 8/2/16 2:06 PM Pengarah Dr. Sugiyono Penanggung Jawab Dr. Dora Amalia Ketua Azhari Dasman Darnis, M.Hum. Anggota Sutiman, Menuk Hardaniwati, Hari Sulastri, Adi Budiwiyanto, Meryna Afrila, Vita Luthia Urfa, Dina Aliyanti Fasa, Denda Rinjaya, Dira Hildayani, Winda Luthita, Ambiya Ikrami Adji, Dewi Khairiah, Kunkun Purwati Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING HAL i.indd 3 iii 8/2/16 2:06 PM KATA PENGANTAR Indonesia adalah gudang terbesar kedua bahasa-bahasa lokal. Terveriikasi sejumlah 617 bahasa daerah hidup di Indonesia dengan tingkat vitalitas yang tidak sama (Badan Bahasa, 2014). Belasan bahasa-bahasa dengan penutur lebih dari satu juta memeiliki tingkat vitalitas tinggi. Sisanya, ratusan bahasa, berada di tubir jurang kepunahan karena penutur yang menjadi penopang hidupnya tidak memenuhi ‘kuota’ vitalitas. Menurut salah seorang peneliti, pada akhir abad ini hanya akan tersisa sepuluh persen bahasa. Artinya, di Indonesia hanya akan tinggal 60 bahasa saja. Seminar Leksikografi Indonesia perdana ini mengangkat tema “Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia’’. Tujuan utama pemilihan tema ini adalah untuk mencari cara yang paling efektif dalam mendokumentasikan leksikon bahasa-bahasa daerah yang berjumlah ratusan dan terancam hilang itu. Melalui tema di atas, beberapa subtema diturunkan. Subtema tersebut adalah: 1. Leksikograi Lapangan dan Penyusunan Korpus Bahasa Daerah. 2. Pemanfaatan Teknologi Informasi dan Komunikasi (TIK) dalam Penyusunan Kamus. 3. Penanganan Dokumentasi Bahasa-Bahasa Daerah. 4. Aspek-Aspek dalam Penanganan Kata-Kata Budaya dalam Kamus. Prosiding seminar ini merupakan kumpulan makalah-makalah yang dipaparkan selama Seminar Leksikograi Indonesia. Terdapat dua alasan utama dalam menyusun prosiding seminar ini. Pertama, untuk memperkaya perbendaharaan ilmu tentang perkamusan atau leksikograi, khususnya leksikograi bahasa-bahasa lokal di Indonesia. Kedua, yaitu untuk merintis terwujudnya sarana ilmiah yang menjadi wadah para leksikograf, pengkritik kamus, dan pencinta kamus di Indonesia. Selain makalah-makalah yang dipaparkan selama seminar, prosiding ini juga memuat rekomendasi yang dihasilkan dari Séminar Leksikograi Indonesia. Kepala Pusat Pengembangan dan Pelindungan Badan Pengembangan dan Pembinaan Bahasa Dr. Sugiyono iv Prosiding Seminar Leksikograi Indonesia PROSIDING HAL i.indd 4 8/2/16 2:06 PM DAFTAR ISI Kata Pengantar ................................................................................................... iv Daftar Isi ............................................................................................................. v Kebijakan Pengembangan Kamus Bahasa Daerah di Indonesia Prof. Dr. Dadang Sunendar, M.Hum. .................................................................. 1 Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia Dr. Sugiyono ......................................................................................................... 7 Pemerian Makna Dr. Hasan Alwi ..................................................................................................... 13 Kamus sebagai Kitab Undang-Undang Deny Arnos Kwary, Ph.D. .................................................................................... 21 Pemanfaatan Korpus dalam Analisis Makna Kata Bersinonim mau, ingin, hendak, dan akan Dewi Puspita, M.A. .............................................................................................. 31 Menuju Pemanfaatan Leksikograis Korpus Bahasa Daerah: Keanekaragaman Tantangan dan Peluang Yanti, Ph.D. dan Nany Setyono Kurnia, Ph.D. ................................................... 41 Survei Program Pengolah Korpus untuk Data Bahasa Indonesia dan Bahasa Daerah di Indonesia Prihantoro ............................................................................................................. 59 Komputasi Linguistik untuk Penyusunan Kamus Bahasa Daerah: Studi Kasus Bahasa Sunda Dadan Sutisna ...................................................................................................... 73 Penelitian Korpus Leksikograi: Aplikasi Fonetik Akustik Berkomputer Dayang Hajah Norati binti Bakar ....................................................................... 87 Perancangan Aplikasi Kamus Mobile Bahasa Madura sebagai Upaya Pelestarian Bahasa Daerah Salim Anshori, S.S. dan Iqbal Nurul Azhar, M.Hum. ......................................... 110 Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING HAL i.indd 5 v 8/2/16 2:06 PM Pengembangan WordNet Bahasa-Bahasa Daerah di Indonesia: Kasus WordNet Bahasa Jawa Totok Suhardijanto, Ph.D. .................................................................................... 121 Beberapa Kendala Pengayaan Kosakata Bahasa Indonesia dari Bahasa Daerah Asep Rahmat Hidayat, M.Hum. ........................................................................... 129 Evaluasi Kamus Bilingual Kamus Bahasa Daerah Using-Indonesia sebagai Upaya Pemertahanan Eksistensi Bahasa Using di Kabupaten Banyuwangi Fajar Erikha, S.Psi. dan Satwiko Budiono, S.Hum. ........................................... 135 Sejarah Perkembangan Leksikograi Tujuh Dialek di Brunei Darussalam Hajah Rosmariah binti Haji Ali .......................................................................... 155 Pembentukan Kamus Pewayangan Bahasa Jawa–Indonesia Berbasis Korpus Ika Nurfarida, S.S. dan Nita Suryawati, S.Hum. ................................................ 165 Redesain Kamus Bahasa Jawa Berdasarkan Tingkatan Bahasa Jawa (Bahasa Jawa Ngoko, Krama Madya, Krama Inggil) Afwin Sulistiawati, S.Pd. ...................................................................................... 181 Lema Budaya: Ketersebaran dan Keterwakilan Semantis Ahmad Fadly, M.Hum. ......................................................................................... 193 Mekanisme Pengolahan dan Penyajian Kosakata Budaya dalam Kamus Pemelajar BIPA Atin Fitriana, M.Hum., Dien Rovita, M.Hum., dan Totok Suhardijanto, Ph.D. ............................................................................. 203 Aspek-Aspek dalam Penanganan Kata-Kata Budaya dalam Kamus Besar Bahasa Indonesia: Nama-Nama Makanan Indonesia Deina, S.S., M.Si. dan Renny Soelistiyowati ...................................................... 227 Lampiran • Rumusan Seminar Leksikograi Indonesia ..................................................... 236 vi Prosiding Seminar Leksikograi Indonesia PROSIDING HAL i.indd 6 8/2/16 2:06 PM Kebijakan Pengembangan Kamus Bahasa Daerah di Indonesia Prof. Dr. Dadang Sunendar, M.Hum. Badan Pengembangan dan Pembinaan Bahasa I. LATAR BELAKANG Indonesia adalah laboratorium bahasa terbesar kedua di dunia setelah Papua Nugini (Spolsky, 2004: 174). Badan Pengembangan dan Pembinaan Bahasa menetapkan jumlah bahasa daerah yang sudah diveriikasi sebesar 617 bahasa dalam hasil penelitian Bahasa dan Peta Bahasa yang akan diterbitkan pada tahun 2016 ini. Artinya, saat ini sekurangkurangnya Indonesia memiliki 617 bahasa daerah yang masih hidup. Dari jumlah tersebut, tidak semua bahasa daerah memiliki tingkat ketahanan atau vitalitas yang sama. Saat ini Badan Bahasa sedang melakukan kajian vitalitas setiap bahasa daerah di Indonesia. Setiap bahasa memiliki ketahanan yang berbeda-beda bergantung pada berbagai faktor, seperti jumlah penutur, letak geograis, dan sikap bahasa penutur terhadap bahasanya. Salah satu aspek yang paling berpengaruh terhadap ketahanan suatu bahasa adalah jumlah penutur Bahasa. Ada penelitian yang memeringkat ketahanan bahasa berdasarkan jumlah penuturnya. Makin besar jumlah penutur bahasa tertentu makin jauh bahasa tersebut dari kepunahan. Sebaliknya, makin sedikit jumlah penuturnya makin bahasa tersebut mendekati jurang kepunahan. Penyusutan jumlah penutur ini biasanya disebabkan antara lain oleh perang, bencana alam yang sangat besar, kawin campur antarsuku, dan sikap bahasa penuturnya. Letak geograis ikut menentukan ketahanan bahasa daerah. Bahasa yang terletak di tempat yang menjadi lalu lintas perekonomian antaretnik, seperti di daerah pesisir dan perkotaan, akan cenderung berubah atau bahkan hilang, meskipun jumlah penuturnya cukup besar. Kontak bahasa yang terjadi akibat komunikasi antaretnik tersebut sedikit banyak akan memengaruhi bahasa setempat. Bahasa yang lebih dominan akan memengaruhi bahasa yang lain. Ketahanan sebuah bahasa daerah tidak selalu berkaitan dengan jumlah penutur yang ada. Sikap penutur terhadap lebih banyak memengaruhi ketahan sebuah bahasa. Sikap bahasa tersebut sangat ditentukan oleh pandangan penutur apakah bahasa yang mereka gunakan tersebut berprestise atau membawa keuntungan, baik secara ekonomis maupun sosial, terhadap kehidupannya. Kecenderungan penutur menggunkan bahasa asing, terutama bahasa Inggris, merupakan cerminan sikap penutur terhadap pilihan bahasanya. Bahasa yang dianggap tidak ekonomis atau memiliki nilai prestise yang rendah, seperti bahasa daerah, rentan untuk ditinggalkan penuturnya. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 1 1 8/2/16 11:17 AM II. KEBIJAKAN PENANGANAN BAHASA DAERAH Sejak tahun 1970-an penanganan bahasa-bahasa di Indonesia didasarkan pada ¬Politik Bahasa Nasional dan Keputusan Kongres Bahasa Indonesia. Sejak tahun 2004, Politik Bahasa Nasional dan keputusan-keputusan kongres itu dilebur menjadi draf RUU Kebahasaan yang akhirnya lahir dalam bentuk Undang-Undang Nomor 24 tahun 2009 pada tanggal 9 Juli 2009. Selanjutnya, sejak tahun 2009 itu, penanganan bahasa-bahasa di Indonesia, baik bahasa negara, bahasa daerah, maupun bahasa asing, didasarkan pada undang-undang itu. Berdasarkan UU No. 24/2009 tersebut, penangan terhadap bahasa dan sastra daerah diklasiikasikan ke dalam tiga hal, yaitu pengembangan, pembinaan, dan pelindungan bahasa dan sastra daerah. Dalam pengembangan bahasa dilakukan upaya memodernkan bahasa melalui pemerkayaan kosakata, pemantapan dan pembakuan sistem bahasa, dan pengembangan laras bahasa. Dalam pembinaan bahasa dilakukan upaya meningkatkan mutu penggunaan bahasa melalui pembelajaran bahasa serta pemasyarakatan bahasa ke berbagai lapisan masyarakat. Selain itu, pembinaan bahasa juga dimaksudkan untuk meningkatkan kedisiplinan, keteladanan, dan sikap positif masyarakat terhadap bahasa itu. Sementara itu, dalam upaya pelindungan dilakukan upaya menjaga dan memelihara kelestarian bahasa melalui penelitian, pengembangan, pembinaan, dan pengajarannya. Di sisi lain, upaya mengarahkan perkembangan bahasa menuju ke keadaan yang dirancang oleh Pusat Pengembangan dan Pelindungan didasarkan pada kondisi kebahasaan di Indonesia yang sangat kaya dengan bahasa daerah. Kekayaan itu di satu sisi merupakan kebanggaan, di sisi yang lain menjadi tugas yang tidak ringan terutama apabila memikirkan bagaimana cara melindungi, menggali manfaat, dan mempertahankan keragamannya. Menurut UNESCO seperti yang tertuang dalam Atlas of the World’s Language in Danger of Disappearing, di Indonesia terdapat kurang lebih 154 bahasa yang harus diperhatikan, yaitu sekitar 139 bahasa terancam punah dan 15 bahasa yang benar-benar telah mati. Bahasa-bahasa yang terancam terdapat di Kalimantan (1 bahasa), Maluku (22 bahasa), Papua Barat dan Kepulauan Halmahera (67 bahasa), Sulawesi (36 bahasa), Sumatera (2 bahasa), dan Timor-Flores dan Bima-Sumbawa (11 bahasa). Sementara bahasa yang telah punah berada di Maluku (11 bahasa), Papua Barat dan Kepulauan Halmahera, Sulawesi, dan Sumatera (masing-masing 1 bahasa). Di antara bahasa-bahasa yang berstatus terancam punah itu pun dari tahun ke tahun mengalami penurunan status, bahkan terdapat 75 bahasa tergolong sekarat (dying). Sementara itu, dari ratusan bahasa daerah itu, hanya sedikit bahasa yang memiliki tata aksara dan tradisi sastra, tetapi sebagian besar hanya berbentuk ujaran lisan. (Sumber: Lewis, M. Paul, Gary F. Simons, and Charles D. Fennig (eds.). 2014. Ethnologue: Languages of the World, Seventeenth edition. Dallas, Texas: SIL International). Catatan di atas dengan jelas menunjukkan bahwa status bahasa daerah ada yang tetap bertahan, tetapi ada yang terancam kepunahan. Dalam keadaan itu, dapat dipastikan 2 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 2 8/2/16 11:17 AM bahasa Indonesia dapat hidup dan berkembang secara lebih baik. Tuntutan komunikasi di daerah-daerah urban serta komunikasi di bidang politik, sosial, ekonomi, dan ipteks di Indonesia memberi peluang hidup yang lebih baik bagi bahasa Indonesia. Penelitian menunjukkan bahwa masyarakat Indonesia yang tinggal di perkotaan mempunyai sikap yang cukup positif terhadap bahasa daerah (Sugiyono dan Sasangka, 2011). Artinya, orang Indonesia masih menganggap bahasa daerah perlu dilestarikan dan digunakan dalam komunikasi di ranah domestik. Hanya saja penelitian ini dilakukan dengan sampel masyarakat perkotaan, terutama kota besar di Indonesia, sehingga belum menggambarkan secara utuh sikap bahasa masyarakat Indonesia secara keseluruhan. III. PENYUSUNAN KAMUS BAHASA DAERAH Kamus bahasa daerah yang ada dalam koleksi perpustakaan Badan Bahasa diterbitkan sejak tahun 1975, yaitu Kamus Bahasa Indonesia-Bali (A-K). Sejak tahun itu sampai dengan tahun 2014 setidaknya ada 123 kamus bahasa daerah yang diterbitkan oleh Badan Bahasa dan UPT-nya. Pada umumnya, tim penyusun kamus tersebut adalah karyawan Badan Bahasa dan hanya sedikit sekali melibatkan orang di luar Badan Bahasa. Oleh karena itu, selama lebih dari empat puluh tahun tersebut kamus yang berhasil diterbitkan hanya sekitar 17% dari 716 bahasa daerah hasil veriikasi Badan Bahasa. Lambatnya laju penambahan jumlah kamus ini menjadi hal yang penting untuk ditangani. Untuk mempercepat laju pertambahan tersebut, mulai tahun 2016 ini, penyusunan kamus bahasa daerah diserahkan kepada masyarakat. Untuk tahun anggaran 2016 ini, Pusat Pengembangan dan Pelindungan mengalokasikan anggaran untuk lebih dari sepuluh kamus bahasa daerah yang saat ini sedang dalam proses penyusunan. Setidaknya pada tahun 2016 ini ada dua belas kamus yang disusun dan pengerjaannya diserahkan kepada masyarakat dan Badan Bahasa memberi fasilitasi berupa konsultasi dan pendampingan. Untuk tahun-tahun mendatang, jumlah penyusunan kamus bahasa daerah ini akan lebih ditingkatkan dengan melibatkan leibih banyak lagi peran serta masyarakat. IV. PERAN BAHASA DAERAH DALAM PENGEMBANGAN KOSAKATA BAHASA INDONESIA Bahasa daerah sangat berperan penting dalam pengembangaan bahasa Indonesia. Peran tersebut terutama dalam hal kontribusi kosakata bahasa daerah dalam memperkaya kosakata bahasa Indonesia dan daya ungkap bahasa Indonesia. Kosakata budaya merupakan kekayaan budaya yang harus ikut mewarnai kosakata bahasa Indonesia. Selain itu, konsep baru dari bahasa asing yang masuk ke dalam bahasa Indonesia dan belum ada padanannya dapat dipadankan dengan kata bahasa daerah yang mungkin memiliki kesamaan konsep dengan bahasa asing. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 3 3 8/2/16 11:17 AM Kebijakan pengembangan kosakata bahasa Indonesia dengan memanfaatkan sumber bahasa daerah tersebut merupakan kebijakan yang dicanangkan oleh Menteri Pendidikan dan Kebudayaan. Oleh karena itu, dalam menyikapi hal ini, Badan Bahasa telah menetapkan sumber terbesar sumbangan kosakata bahasa Indonesia berasal dari bahasa daerah dengan target minimal 13.000 kata per tahun. Target tersebut akan dapat tercapai jika ada peran aktif dari setiap Balai/Kantor Bahasa yang merupakan UPT Badan Bahasa di setiap provinsi. Keterlibatan masyarakat dalam hal ini telah difasilitasi oleh Badan Bahasa dengan menyediakan kemudahan akses menyumbangkan kosakata daerah melalui aplikasi daring. Inventarisasi kosakata bahasa daerah untuk disumbangkan ke dalam bahasa Indonesia sekaligus dapat dilakukan bersamaan dengan penyusunan kamus bahasa daerah. Oleh sebab itu, kedua kegiatan ini dapat dilakukan secara paralel karena saling mendukung satu sama lain. Melalui seminar ini pula, peserta yang khususnya berasal dari daerah, dapat menyumbangkan kosakata bahasa daerahnya dan sekaligus dapat menyebarluaskan informasi ini kepada masyarakat yang lebih luas. V. PEMBENTUKAN ASOSIASI PEKAMUS INDONESIA Penyusun kamus atau pekamus merupakan profesi yang masih sangat baru di Indonesia. Penyusunan kamus memerlukan keterampilan yang sangat khusus dan oleh sebab itu tidak banyak yang menggeluti pekerjaan ini secara profesional. Namun demikian, perkembangan ilmu pengetahuan dan kebutuhan masyarakat terhadap bahan rujukan akan membuka peluang pekerjaan pekamus menjadi makin dibutuhkan. Akhirakhir ini makin bervariasi kamus-kamus yang beredar di pasaran, baik itu kamus saku, kamus pelajar, maupun kamus bidang ilmu, dan sebagainya. Media kamus pun makin beragam, tidak hanya dalam bentuk cetak, tetapi juga dalam bentuk elektronik, bahkan dalam jaringan (daring). Keberagaman produk kamus tentu saja membutuhkan keahlian yang makin beragam pula. Oelh sebab itu, profesi pekamus tidak lagi hanya diisi oleh ahli bahasa, tetapi juga oleh ahli di bidang ilmu tertentu dan ahli teknologi informasi. Untuk mewadahi orang-orang yang terlibat dalam penyusunan kamus, kami berharap dari seminar ini akan muncul pemikiran untuk membentuk asosiasi penyusun kamus atau pekamus di Indonesia. Wadah ini diperlukan sebagai ajang komunikasi dan bertukar pikiran untuk kemajuan perkamusan di Indonesia dan sebagai wadah untuk menyampaikan informasi terbaru tentang tren leksikograi dunia dan perkembangan leksikograi teoretis. Akhirnya, semoga dari seminar ini akan muncul pemikiran-pemikiran baru yang berguna untuk kemajuan leksikograi Indonesia, khususnya dalam penyusunan kamus bahasa daerah. Selamat berseminar. 4 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 4 8/2/16 11:17 AM Daftar Pustaka Kurniawati, Wati (Ed.). akan terbit. Bahasa dan Peta Bahasa. Edisi ketiga. Jakarta: Badan Pengembangan dan Pembinaan Bahasa. Lewis, M. Paul, Gary F. Simons, and Charles D. Fennig (eds.). 2014. Ethnologue: Languages of the World, Seventeenth edition. Dallas, Texas: SIL International. Pusat Pengembangan dan Pelindungan. 2016. Rencana Strategis Pusat Pengembangan dan Pelindungan. Jakarta: Badan Pengembangan dan Pelindungan. Spolsky, Bernard. 2004. Language Policy. Cambridge: Cambridge University Press. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 5 5 8/2/16 11:17 AM 6 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 6 8/2/16 11:17 AM Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia Dr. Sugiyono Badan Pengembangan dan Pembinaan Bahasaa I. KONDISI KEBAHASAAN DI INDONESIA Proil kebahasaan di Indonesia ditandai dengan banyaknya bahasa yang terancam punah. Seperti yang dikutip dari Ethnologue.com bahwa ada sekitar 719 bahasa yang tercatat di Indonesia. Sebanyak 706 di antaranya adalah bahasa yang masih hidup, dengan perincian 21 bahasa sudah dibakukan, 97 bahasa sedang berkembang, 248 bahasa kuat, 265 bahasa terancam punah, dan 75 bahasa hampir punah. Gambar 1. Proil kebahasaan di Indonesia (dikutip dari: Ethnologue.com) Bilah graik 1-5 pada gambar di atas menunjukkan status bahasa yang baku dan digunakan secara luas, bahkan digunakan dan diajarkan melalui institusi. Adapun bilah 6a menunjukkan kondisi bahasa yang masih digunakan secara luas, tetapi belum dibakukan. Bilah graik 6a-7 menunjukkan kondisi yang ditandai oleh mulai tersendatnya transmisi bahasa antargenerasi. Pada tahap inilah perlu dilakukan upaya revitalisasi. Status bahasa yang mulai menuju ke kepunahan, ditunjukkan oleh bilah graik 8a-9 yang ditandai oleh bahasa yang hanya dikuasai oleh penutur tua saja, sedangkan bilah 9-10 menunjukkan bahasa yang sudah benar-benar punah. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 7 7 8/2/16 11:17 AM Bahasa-bahasa daerah yang jumlahnya ratusan di Indonesia tersebut sangat kental dengan tradisi lisan. Artinya, bahasa-bahasa daerah tersebut biasanya ditandai dengan tidak adanya tradisi tulis dan hal itu berarti bahwa tidak ada korpus bahasa daerah yang tersedia. Hampir semua data berasal dari tradisi lisan, baik itu berupa percakapan lisan, lagu, dongeng, nasihat yang harus dijaring melalui metode pengumpulan data lapangan. Oleh karena itu, penyusunan kamus untuk bahasa-bahasa daerah tersebut masuk dalam cabang leksikograi lapangan (ield lexicography) atau leksikograi bahasa hampir punah (endangered languages lexicography). Produk dari leksikograi lapangan adalah kamus lapangan (ield dictionary), yaitu “dictionaries exist only for ‘minor’ languages, spoken in small communities without any tradition of written literature” (Béjoint, 1983: 70). Kondisi lain yang menandai proil kebahasaan di Indonesia adalah banyaknya bahasa yang statusnya terancam punah, terutama bahasa-bahasa daerah yang ada di Indonesia bagian timur. Kondisi seperti itu membutuhkan penanganan yang cepat sebelum bahasa-bahasa tersebut punah. Penyusunan kamus sebagai salah satu usaha dokumentasi bahasa harus berpacu dengan waktu dan harus berhadapan dengan ratusan bahasa daerah yang membutuhkan penangan segera. Oleh karena itu, perlu ditemukan metode yang tepat dan sekaligus cepat untuk mengumpulkan data, menyusun korpus, dan menyusun kamus. Hal-hal tersebut akan dibicarakan dalam makalah ini. II. SEJARAH LEKSIKOGRAFI INDONESIA Leksikograi di Indonesia ditandai dengan penyusunan kamus dwibahasa. Diawali dengan hanya leksikograi tertua di Indonesia yang berupa daftar kata Cina-Melayu yang disusun pada awal abad XV yang memuat 500 lema. Setelah itu Pigafetta, seorang berkebangsaan Italia, membuat daftar kata Italia-Melayu pada tahun 1522. Selanjutnya pada tahun 1603 Frederick de Houtman menyusun kamus Spraeck ende woordboek, Inde Malaysche ende Madagaskarsche Talen met vele Arabische ende Turksche Woorden. Beberapa tahun kemudian, yaitu tahun 1623, Casper Wiltens dan Sebastian Danckaerts menyusun kamus Belanda-Melayu dan Melayu-Belanda yang berjudul Vocabularium ofte woordboek naer order vanden Aphabet in’t Duytsch-Maleysche ende MalayscheDuytsch. Lexicon Javanum (anonim) terbit tahun 1706 dan naskahnya sekarang tersimpan di perpustakaan Vatikan. Lalu setelah itu ada tiga kamus yang terbit tahun 1800-an, yaitu Dictionary of the Malayan Language (Marsden, 1812); Nederduitsch-Maleisch en Soendasch Woordenboek (A. De Wilde, 1841), dan Bataksch-Nederduitsch Woordenboek (van der Tuuk, 1861). Minat pada bahasa dan perkamusan pada zaman itu (kolonial) terbatas pada orang asing saja. Kamus-kamus tersebut disusun pada umumnya untuk keperluan penyebaran agama dan kepentingan dagang untuk berkomunikasi dengan penduduk setempat. Walaupun ada beberapa dari penyusun kamus tersebut adalah ahli bahasa, seperti van der Tuuk dan A. De Wilde, sebagian besar mereka mempunyai latar belakang yang beragam. 8 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 8 8/2/16 11:17 AM Barulah pada awal abad ke-19, kamus mulai disusun oleh orang pribumi. Raja Ali Haji dari Riau menyusun Kitab Pengetahuan Bahasa yang memuat daftar kata bahasa Melayu. Kamus ini diterbitkan oleh Al Ahmadiah Press, Singapura tahun 1928. Setelah itu pada tahun 1930 disusunlah Baoesastra Djawa oleh W.J.S. Poerwadarminta, C.S. Hardjasoedarma, and J.C. Poedjasoedira. Adapun kamus bahasa Sunda modern disusun oleh R. Satjadibrata pada tahun 1948 dengan judul Kamoes Bahasa Soenda. Dari sejarah perkamusan di Indonesia tersebut, dapat disimpulkan bahwa leksikograi di Indonesia pada awalnya diwarnai dengan penyusunan kamus bahasa daerah. Beberapa bahasa daerah, seperti bahasa Jawa, telah mempunyai aksara dan naskah-naskah yang dapat dijadikan sumber data, tetapi tidak demikian halnya dengan bahasa-bahasa daerah yang lain yang tidak memiliki tradisi tulis. Penyusunan kamus tersebut dilakukan dengan mencatat semua bentuk kebahasaan secara langsung dari penutur bahasa daerah. Pada proses ini, penyusun kamus telah melakukan metode leksikograi lapangan. III. STRATEGI LAMA PENYUSUNAN KAMUS Penyusunan kamus bahasa daerah yang dilakukan oleh Badan Pengembangan dan Pembinaan Bahasa, dahulu Pusat Bahasa, telah dimulai pada tahun 1970-an. Terbitan kamus bahasa daerah yang tercatat paling awal, yaitu kamus .... yang terbit pada tahun 1975. Selanjutnya, kamus-kamus bahasa daerah terus disusun sampai dengan sekarang sehingga berjumlah 123 kamus, baik bahasa daerah-bahasa Indonesia, maupun bahasa Indonesia-bahasa daerah. Jika dibandingkan dengan jumlah bahasa daerah hasil inventarisasi Badan Bahasa sebesar 617 bahasa (data tahun 2014), penyusunan kamus bahasa daerah baru mencapai angka 17% saja dari semua bahasa daerah di Indonesia. Hal tersebut berarti ada sekitar 83% atau sekitar 500-an bahasa daerah yang belum disusun kamusnya. Oleh karena itu, pekerjaan penyusunan kamus bahasa daerah tersebut tidak mungkin dilakukan oleh Badan Bahasa semata. Penyusunan kamus bahasa daerah selama ini dilakukan dengan strategi sebagai berikut. 1. Penyusunan dilakukan oleh pekamus dari Pusat Bahasa. Penyusunan kamus bahasa daerah selama ini dilakukan oleh pekamus dari Badan Bahasa dulu Pusat Bahasa dan UPT Balai/Kantor yang tersebar di daerah. Ada beberapa kamus bahasa daerah yang disusun oleh masyarakat, tetapi jumlahnya sangat sedikit. Itu juga sebagian besar dilakukan oleh penyusun yang pernah mengikuti pelatihan di Pusat Bahasa. Kamus Bahasa Betawi dan Kamus Bahasa Gorontalo, sebagai contoh. Terdapat juga beberapa kamus bahasa daerah yang disusun oleh masyarakat dan beberapa peneliti asing untuk keperluan penelitian atau karena kecintaan terhadap bahasa tertentu. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 9 9 8/2/16 11:17 AM 2. Masyarakat pemilik bahasa diposisikan hanya sebagai narasumber dalam penyusunan kamus. Pekamus dari Pusat Bahasa turun ke daerah atau menghadirkan penutur bahasa daerah untuk menjadi narasumber dalam penyusunan kamus. Malalui narasumber digali kekayaan bahasa daerah tertentu. Pekamus dibekali dengan ilmu leksikograi, fraseologi, semantik leksikal, fonologi, dan sebagainya dalam menggali kekayaan bahasa daerah dan menyajikannya dalam bentuk kamus. Hasil penyusunan berupa kamus belum tentu akan sampai ke hadapan narasumber. Biasanya hanya menjadi bahan penelitian di kampus-kampus atau Balai/Kantor Bahasa. 3. Hasil dari penyusunan kamus dicetak Belum terdapat teknologi penyebarluasan hasil penyusunan kamus selain dari pencetakan dan pengiriman. Kita mendapati kamus-kamus berbahasa daerah terbitan Pusat Bahasa di berbagai perpustakaan kampus dalam kondisi masih bagus dan tua karena jarang dibuka. Kamus tersebut hanya sesekali dibuka untuk penelitian mahasiswa atau tugas kuliah. Jarang sekali kamus bahasa daerah dibuka selain untuk keperluan penelitian. 4. Belum menggunakan aplikasi teknologi informasi Cara penyusunan kamus mulai dari pemilihan sampai penyuntingan masih dilakukan dengan cara manual. Penulisan entri di slip terkadang masih dilakukan. Terdapat tempat khusus untuk penyimpanan data yang dapat berupa ruangan tersendiri. Penyimpanan memerlukan ruangan dan cara pengolahan dokumen tersendiri. Cara ini tidak lagi efektif dan eisien saat ini. Belum terdapat pangkalan data yang sudah diolah secara modern yang memudahkan konversi data ke dalam berbagai aplikasi nantinya. Strategi penyusunan kamus seperti tersebut di atas hanya mampu menghasilkan sedikit kamus bahasa daerah. Oleh karena itu, perlu dicari strategi baru dapat mengatasi masalah kepunahan bahasa dengan mempercepat langkah dokumentasi bahasa melalui penyusunan kamus. Diperlukan cara pendokumentasian bahasa melalusi penyusunan kamus yang cepat, praktis, dan mudah. IV. USULAN STRATEGI PENYUSUNAN KAMUS BAHASA DAERAH Untuk menjawab kebutuhan penyusunan kamus yang cepat diperlukan strategi baru yang sesuai dengan perkembangan teknologi. Strategi baru tersebut sebagai berikut. 1. Pelibatan masyarakat Sejalan dengan kebijakan Kementerian Pendidikan dan Kebudayaan yang menjadikan masyarakat sebagai ekosistem pendidikan, penyusunan kamus juga harus melibatkan masyarakat pemilik bahasa. Pelibatan masyarakat tidak hanya dimanfaatkan sebagai 10 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 10 8/2/16 11:17 AM narasumber, tetapi sebagai penyusun sekaligus. Dalam penyusunan tersebut masyarakat dibantu dengan aplikasi dan penyunting dari Badan Bahasa. Aplikasi diperlukan untuk memudahkan penyusunan, sedangkan penyunting bertugas memperbaiki dan menyempurnakan deinisi, contoh penggunaan, kelas kata dan sebagainya. Dengan cara ini, kalau setiap penutur membuat kamus bahasanya sendiri, kamus 600-an bahasa daerah akan cepat terwujud sekaligus dengan dialek-dialeknya yang tak kalah banyak juga. Namun cara ini bukannya tidak memiliki kendala, seperti kurangnya penyunting kamus. Usaha ke arah ini sudah dilakukan. Tahun ini Badan Bahasa sudah melakukan dua kali bengkel penyusunan kamus untuk Indonesia bagian Bbarat dan Timur. Untuk bagian barat diadakan di Medan, sedangkan untuk bagian timur diadakan di Makassar. Pada bengkel itu diajarkan cara praktis penyusunan kamus. Dikenalkan pula aplikasi penyusunan kamus, aplikasi pemilihan contoh, dsb. Pengenalan aplikasi disertai dengan praktik langsung. Peserta bengkel terdiri atas pekamus dari Balai/ Kantor, dosen/mahasiswa perguruan tinggi, dan masyarakat umum. 2. Penggunaan sarana teknologi informasi yang tepat. Teknologi informasi berkembang dengan cepat, bahkan sangat cepat. Teknologi baru bermunculan mengungguli teknologi baru lain. Terdapat banyak sekali aplikasi penyusunan kamus, baik dari penyediaan basis data, pembangunan korpus, bahkan pembuatan antarmuka yang bagus. Baik yang berbayar, maupun gratis. Dalam pemilihan aplikasi, Badan Bahasa memilih membeli aplikasi, alih-alih menggunakan aplikasi gratis karena berkaitan dengan keamanan data kamus yang sangat penting. 3. Pemanfaatan jaringan internet Dunia sudah menjadi kampung kecil. internet menghubungkan setiap orang. Memudahkan lalu lintas data. Penyebaran kamus yang sebelumnya dilakukan melalui pencetakan dan pengiriman sekarang dapat dilakukan dengan lebih cepat, supercepat bahkan, jauh lebih murah, dan mudah, selama terdapat jaringan internet. Setiap orang dapat memiliki akses terhadap kamus, bahkan dapat membuat aplikasi dari data yang ada. Sebagai contoh, KBBI edisi III memiliki puluhan aplikasi yang dibuat oleh masyarakat sendiri. Setiap aplikasi memiliki kekurangan dan kelebihan masing-masing. Masyarakat memiliki kebebasan dalam menentukan aplikasi KBBI yang sesuai dengan kebutuhan mereka. Saat ini, lebih banyak masyarakat membuka KBBI dibanding dulu. 4. Pemanfaatan Korpus Korpus, sederhananya, merupakan kumpulan beberapa teks bahasa yang dapat digunakan untuk penelitian linguistik. Saat ini, korpus tidak hanya dimanfaatkan oleh para peneliti. Pekamus dan penyusun tata bahasa juga sudah menyandarkan hasil karyanya pada korpus agar teori dan kamus yang dihasilkan tidak bersifat priskriptif belaka, tetapi juga memenuhi unsur deskriptifnya atau perpadua dari Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 11 11 8/2/16 11:17 AM keduanya yang biasa disebut dengan proskriptif. Melalui penelitian korpus, informasi yang tersaji dalam kamus tidak hanya bersifat ‘bagaimana seharusnya’ saja, tetapi juga ‘bagaimana kenyataanya’. Dengan cara ini keberterimaan sebuah kata berikut deinisi dan kelengkapan lain di tengah pengguna kamus tinggi. Korpus merupakan sumber data otentik pemakaian bahasa oleh pengguna. Melalui data yang ada di korpus, konteks, deinisi, kelas kata, ranah penggunaan, ragam, register, contoh, dan sebagainya dapat diketahui dengan pasti. Pekamus tinggal memadukan antara kenyataan penggunaan di lapangan dengan kaidah yang disepakati. Penggunaan korpus bersifat melengkapi kemampuan intuitif pekamus. Melalui korpus, pekamus dapat menemukan realisasi dari makna suatu kata. Pekamus tidak perlu lagi meraba makna, kelas kata, ragam dan sebagainya kemudian mengarang contohnya. Semua sudah tersedia dalam korpus. Pekamus tinggal menyempurnakannya dan memilih yang paling sesuai. Korpus dapat mengurangi subjekivitas pekamus. Semua berasal dari sumber data yang ada yang berasal dari masyarakat. Korpus bahasa daerah masih asing di telinga. Belum terdapat korpus tersendiri yang berisi kekayaan bahasa daerah tertentu, tetapi sudah ada beberapa laman yang berisi bahasa daerah tertentu. Surat kabar berbahasa daerah, wikipedia berbahasa daerah, komunitas lokal, blog pribadi, dan sebagainya dapat dijadikan korpus sebagai dasar pembuatan deinisi, kelas kata, contoh dsb kamus bahasa daerah. Daftar Pustaka Béjoint, Henry. 1983. “Field Dictionaries” dalam Lexicography: Principles and Practice. London: Academic Press. Hartmann, R.R.K. 2001. Teaching and Researching Lexicography. Edinburg: Pearson Education Limited. Moe, Ronald. 2007. ”Dictionary Development Program” dalam SIL Forum for Language Fieldwork 2007-009. Ron Moe and SIL International. Svensen, Bo. 2009. “Lexicography” dalam A Handbook of Lexicography: The Theory and Practice of Dictionary-Making. Cambridge: Cambridge University Press. Sumber Daring: Ethnologue: Languages of The World. Diakses dari http://www.ethnologue.com/proile/ ID, tanggal 20 Juli 2016. 12 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 12 8/2/16 11:17 AM Pemerian Makna1 Hasan Alwi [email protected] Dalam kegiatan penyusunan kamus, menyusun deskripsi makna lema/sublema merupakan tahapan yang utama dan sangat menentukan bagi keberhasilan kamus yang diterbitkan. Oleh karena itu, sering dikatakan bahwa mutu kamus ditentukan oleh ketepatan perumusan deinisinya, di samping ditentukan juga oleh kepraktisan contoh pemakaian dari lema/sublema yang dideskripsikan maknanya tersebut. Karena lema/ sublema yang dideinisikan itu pada dasarnya harus ditinjau dari atau dihubungkan dengan kelas katanya, maka perumusan makna itu harus memperhatikan atau bahkan didasarkan pada kelas kata lema/sublema yang bersangkutan. Dengan perkataan lain, cara merumuskan kata yang tergolong nomina, misalnya, haruslah berbeda dari cara merumuskan kata yang tergolong verba atau adjektiva. Demikian pula halnya dengan kata yang tergolong partikel harus dirumuskan dengan cara yang tidak sama dengan perumusan kata yang termasuk adverbia atau kelas kata lainnya. Sehubungan dengan hal itu, berikut ini dicontohkan perumusan kata rumah, sekolah, kantor, dan masjid yang kesemuanya berkelas kata nomina dan “diperkirakan” memiliki ciri-ciri semantis yang bermiripan.Kutipan pemerian makna di bawah ini sesuai dengan yang tercantum di dalam Kamus Besar Bahasa Indonesia Edisi IV (KBBI IV, 2008). ru.mah n 1 bangunan untuk tempat tinggal; 2 bangunan pd umumnya (spt gedung); ... (KBBI IV, 2008: 1188) se.ko.lah n 1 bangunan atau lembaga untuk belajar dan mengajar serta tempat menerima dan memberi pelajaran (KBBI IV, 2008: 1244) kan.tor n 1 balai (gedung, rumah, ruang) tempat mengurus suatu pekerjaan (perusahaan dsb); 2 tempat bekerja; (KBBI IV, 2008: 619) mas.jid n rumah atau bangunan tempat bersembahyang orang Islam (KBBI IV, 2008: 883) Pada deinisi keempat nomina di atas terdapat tiga kata kunci yang juga diperkirakan memiliki kemiripan dalam ciri-ciri semantisnya, yaitu kata bangunan, balai dan gedung. Berikut adalah kutipan deskripsi makna dari ketiga kata tersebut. Makalah Seminar Leksikograi Indonesia dengan tema “Tantangan Leksikograis Bahasa-bahasa Daerah di Indonesia”, Badan Pengembangan dan Pembinaan Bahasa, Kementerian Pendidikan dan Kebudayaan, Hotel Santika, Taman Mini Indonesia Indah, 26--29 Juli 2016 1 Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 13 13 8/2/16 11:17 AM ba.ngun.an n sesuatu yg didirikan; sesuatu yg dibangun (spt rumah, gedung, menara); (KBBI IV, 2008: 134) ba.lai n 1 gedung; rumah (umum); kantor; 2 kl rumah (dl lingkungan istana); ... ge.dung n 1 bangunan tembok dsb yg berukuran besar sbg tempat kegiatan, spt perkantoran, pertemuan, perniagaan, pertunjukan, olahraga, dsb; 2 rumah tembok yg berukuran besar; (KBBI IV, 2008: 425) Sehubungan dengan masjid yang berfungsi sebagai ‘tempat bersembahyang orang Islam’, deskripsi makna masjid ini perlu pula dibandingkan dengan nama bangunan bagi para pemeluk agama yang lain. gereja/ge·re·ja/ /geréja/ n 1 gedung (rumah) tempat berdoa dan melakukan upacara agama Kristen: di situ ada -- yang besar; 2 badan (organisasi) umat Kristen yang sama kepercayaan, ajaran, dan tata cara ibadahnya (KBBI IV, 2008: 445) pu·ra n tempat beribadat (bersembahyang) umat Hindu Dharma; (KBBI IV, 2008: 1119) ke.len.teng /kelenténg/ n bangunan tempat memuja (berdoa, bersembahyang) dan melakukan upacara keagamaan bagi penganut Konghucu (KBBI IV, (2008: 655) Dalam takrif masjid terdapat frasa tempat bersembahyang orang Islam. Dalam takrif pura digunakan frasa umat Hindu Dharma, sementara frasa penganut Konghucu muncul dalam takrif kelenteng. Makna umat pada umat Hindu Dharma atau penganut pada penganut Konghucu pasti berhubungan dengan agama atau kepercayaan. umat n 1 para penganut (pemeluk, pengikut) suatu agama; penganut nabi; 2 makhluk manusia; (KBBI IV, 2008: 1524) pe·me·luk n 1 orang yg memeluk; 2 ki penganut ajaran: (KBBI IV, 2008: 1042) peng·a·nut n pengikut (aliran politik); pemeluk (agama, kepercayaan): (KBBI IV, 2008: 79) peng·i·kut n 1 penganut; 2 peserta(KBBI IV, 2008 (KBBI IV, 2008: 523 Berbeda dengan umat, pemeluk, penganut, dan pengikut, makna orang tidak harus selalu memiliki ciri semantis ‘agama’. Adapun orang pada frasa orang Islam, jika dilihat dari deskrpisi makna orang yang dikodiikasikan dalam kamus, pasti berhubungan dengan ciri semantis ‘agama’, sebagaimana yang dimaksudkan dengan manusia dalam arti khusus. Dengan ciri makna ini, para pemeluk agama Kristen, Hindu, dan Konghucu pun masing-masing dapat pula dinyatakan lewat frasa orang/umat Kristen, orang/umat Hindu, dan orang/umat Konghucu. orang n 1 manusia (dl arti khusus); 2 manusia (ganti diri ketiga yg tidak tentu): jangan lekas percaya pd mulut --; 3 dirinya sendiri; manusianya sendiri: saya tidak bertemu dng -- nya; 4 kata penggolong untuk manusia: lima -- nelayan; 5 anak buah (bawahan): mereka itu -- nya Pak Camat; 6 rakyat (dr suatu negara); warga negara: -- Pakistan; 7 manusia yg berasal dr atau tinggal di suatu daerah (desa, kota, negara, dsb): dia -- Bogor; suaminya -- Eropa; 8 suku bangsa; 9 manusia lain; bukan diri sendiri; bukan kaum (golongan, kerabat) sendiri: jangankan anak 14 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 14 8/2/16 11:17 AM sendiri, anak -- pun saya tolong; negeri -- , negeri lain (bukan negeri kita); 10 cak karena (sebenarnya): mana dapat membayar, -- belum gajian; (KBBI IV, 2008: 986) Yang dilakukan oleh umat Islam/Kristen/Hindu/Konghucu di tempat peribadatan masing-masing adalah bersembahyang, beribadat, berdoa, atau memuja. Sepintas lalu, keempat perbuatan/kegiatan ritual memiliki makna yang kurang lebih sama. Untuk itu, simaklah apa yang dikodiisikan kamus mengenai keempat kegiatan itu. ber·sem·bah·yang v 1 melakukan sembahyang (salat): mereka- hari raya di lapangan dekat masjid Al-Azhar; 2 berdoa (memohon) kpd Tuhan: - di gereja; 3 upacara selamatan untuk menghormati (memuliakan) para leluhur dsb: - Tahun Baru; (KBBI IV, 2008: 1259) iba·dat n 1 ibadah; 2 segala usaha lahir dan batin sesuai dng perintah Tuhan untuk mendapatkan kebahagiaan dan keseimbangan hidup, baik untuk diri sendiri, keluarga, masyarakat maupun thd alam semesta; 3 upacara keagamaan; ber·i·ba·dat v menunaikan ibadat; (KBBI IV, 2008: 515) ber·doa v mengucapkan (memanjatkan) d(KBBI IV, 2008oa kpd Tuhan (KBBI IV, 2008: 337 me·mu·ja v 1 menghormati dewa-dewa dsb dng membakar dupa, membaca mantra, dsb; 2 memuja-muja; 3 menjadikan sesuatu dng mantra: ia ~ anak yg tidak tahu budi itu hingga menjadi batu; (KBBI IV, 2008: 1112) Kata bersembahyang, beribadat, berdoa, dan memuja tergolong verba. Untuk makna untuk lema/sublema yang berkelas kata verba berikut ini dicontohkan verba yang erat kaitannya dengan perbuatan yang dilakukan dengan menggunakan tangan dan kaki, yaitu melempar, memukul, menyepak, dan menendang. me.lem.par v 1 membuang jauh-jauh; 2 melontari (dng) (KBBI IV, 2008: 811). me.mu.kul v 1 mengenakan suatu benda yg keras atau berat dng kekuatan (untuk mengetuk, memalu, meninju, menohok, menempa, dsb) ... me.nye.pak v memukul dng kaki; menendang; mendepak; (KBBI IV, 2008: 1278) me·nen·dang v 1 menyepak; mendepak (dng kaki): ia berusaha ~ bola ke arah gawang lawan; 2 mengusir; memecat; mengeluarkan (dr kantor, perusahaan, organisasi, dsb): berdasarkan undang-undang perburuhan, setiap pemimpin tidak dapat ~ bawahannya begitu saja tanpa alasan yg kuat; 3 mendesak (mendorong) kuat-kuat: bocoran pd pipa gas disebabkan oleh tekanan gas yg kuat yg ~ klep pipa hingga meletup; (KBBI IV, 2008: 1438) Dari deinisi itu terlihat bahwa pada melempar dan memukul peran tangan sama sekali tidak dimunculkan secara eksplisit. Hal ini berbeda dengan deinisi menyepak dan menendang yang secara jelas menyebutkan bahwa perbuatan yang dimaksudkan dilakukan dengan menggunakan kaki. Pada verba membakar dan memotong berikut ini yang berperan tidak hanya tangan, tetapi ada semacam alat yang digunakan untuk melaksanakan perbuatan yang bersangkutan, yaitu api untuk membakar dan barang tajam untuk memotong. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 15 15 8/2/16 11:17 AM mem.ba.kar v menghanguskan (menyalakan, meru¬sak¬kan) dng api (KBBI IV, 2008:121) me.mo.tong v 1 memutuskan dng barang tajam; me¬ngerat; memenggal. (KBBI IV, 2008: 1096) Pada contoh berikut ditampilkan deskripsi makna tentang lema/sublema yang tergolong adjektiva. Kata sedih dan senang pasti menggambarkan keadaan atau suasana hati seseorang, sedangkan kata gelap dan terang ada atau erat kaitannya dengan ada atau tidak adanya cahaya di suatu tempat tertentu. se.dih a 1 merasa sangat pilu dl hati; susah hati; ...; 2 menimbulkan rasa susah (pilu dsb) dl hati; duka (KBBI IV, 2008: 1238) se.nang a 1 puas dan lega, tanpa rasa susah dan kecewa, dsb ...; 2 betah ...; 3 berbahagia (tidak ada sesuatu yg menyusahkan, tidak kurang suatu apa dl hidupnya) ...; 4 suka; gembira (KBBI IV, 2008: 1267) ge.lap a 1 tidak ada cahaya; kelam; tidak terang ...; 2 malam ...; 3 tidak atau belum jelas (tt perihal, perkara, dsb); samar ...; 4 rahasia (tidak secara terang-terangan); tidak halal atau tidak sah; tidak menurut aturan (undang-undang hukum) yg berlaku (KBBI IV, 2008: 428) te.rang a 1 dl keadaan dapat dilihat (didengar); nyata; jelas ... ; 2 cerah; bersinar ...; 3 siang hari ...; 4 bersih (tt halaman atau kebun) krn dibersihkan (disiangi, ditebangi, dsb) ...; 5 jernih; bersih (tt udara, langit) ...; 6 sah (tt bukti, barangbarang, dsb) ...; 7 terbukti (kebenarannya, kesalahannya, dsb) ...; 8 cahaya; sinar (KBBI IV, 2008: 1448) Sehubungan dengan deskripsi makna kata yang berkategori adjektiva ini, secara khusus perlu dikemukakan catatan mengenai tinggi dan panjang yang masing-masing lawan katanya ialah rendah dan pendek. Akan tetapi, dalam kenyataan berbahasa di Indonesia tinggi tidak dikontraskan dengan rendah, tetapi dengan pendek. Bahwa dalam BI pendek merupakan lawan kata tinggi, hal itu sudah merupakan kelaziman berbahasa yang tidak perlu dipertanyakan lagi. Namun, jika kita mencermati takrif kamus, baik kamus bahasa Indonesia maupun kamus bahasa Melayu, dan mengingat-ingat kembali ungkapan lama, termasuk peribahasa, kita akan menyadari bahwa tinggi berkontras dengan rendah, bukan dengan pendek (yang sudah lazim sebagai lawan kata panjang). Perhatikan contoh pemakaiannya sbb. • • • Suaranya terlalu tinggi, rendahkan satu oktaf lagi. Pangkatnya sudah tinggi, pangkat saya sih masih rendah. Bagaimanapun kita mesti duduk sama rendah dan berdiri sama tinggi. Contoh berikut jelas memperlihatkan bahwa dalam bahasa Indonesia digunakan pasangan tinggi dan pendek, sementara dalam bahasa Melayu kelazimannya adalah pasangan tinggi dan rendah (khususnya dalam mendeskripsikan ukuran tubuh manusia). 16 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 16 8/2/16 11:17 AM Bila pria memiliki tubuh pendek, jangan merasa minder. Pasalnya, mereka yang bertubuh pendek ternyata lebih panjang umur. (http://lifestyle.okezone.com/read/2014/05/19/482/986931/pria-pendek-tak-perluminder-anda-lebih-panjang-umur) Senario sekarang, apabila profesion seperti juruterbang, pramugari, polis, dan askar turut menjadikan ketinggian antara syarat utama, menyebabkan mereka yang bertubuh rendah mempunyai peluang yang agak terhad dalam memilih pekerjaan. (http://www.utusan.com.my/gaya-hidup/keluarga/tubuh-berhenti-meninggi-1.24161) Takrif pendek dan rendah menurut Kamus Besar Bahasa Indonesia Edisi IV (KBBI IV) dan Kamus Dewan Edisi IV (KD IV) adalah sebagai berikut. pen·dek /péndék/ a 1 dekat jaraknya dr ujung ke ujung: penggaris --; 2 dekat jaraknya dr sebelah bawah; tidak tinggi: buah jambu dapat dipetik anak-anak krn pohonnya masih --; 3 sebentar (tt waktu): dl waktu yg -- kemelut itu dapat diatasi; 4 ringkas; singkat (tt cerita dsb): cerita --; (KBBI IV, 2008: 1044) pendek (péndék) 1. tidak panjang, tidak tinggi, pandak, rendah, ringkas; 2. tidak lama, singkat; (KD IV, 20071171) 1 ren·dah a 1 dekat ke bawah; tidak tinggi; 2 hina; nista: -- budi; (KBBI IV, 2008: 1163) rendah I 1. tidak jauh jaraknya dr bawah, tidak tinggi (lwn tinggi); sedang (saja) rendahnya (badan orang)2 (KD IV, 2007: 1313) Telah dikemukakan bahwa ketepatan mendeskripsikan makna lema/sublema merupakan syarat utama dalam penyusunan kamus. Tingkat ketepatan pendeskripsian makna itu akan sangat ditentukan oleh seberapa jauh deinisi yang dirumuskan itu menggambarkan komponen makna yang secara inheren merupakan konsep inti yang terkandung di balik lema/sublema yang bersangkutan. Untuk jenis permainan dalam bidang olahraga, misalnya, deskripsi makna yang disusun haruslah menyinggung sekurang-kurangnya tiga hal, yaitu pemain, alat yang digunakan, dan tempat permainan atau cara bermain. Untuk itu, contoh tentang bulu tangkis, sepak bola dan tenis di bawah ini perlu disimak untuk mendeinisikan ketiga hal tersebut. bu.lu tang.kis n cabang olahraga yg berupa permainan yang dimainkan dng memakai raket dan kok yg dipukul melampaui jaring yg direntangkan di tengah lapangan; badminton; (KBBI IV, 2008: 221) 2 Selain merupakan antonim dari tinggi, makna rendah yang lainnya adalah (1) tidak nyaring, lembut, perlahan (suara dll); (2) ~ hati suka merendahkan diri, tidak angkuh (sombong, bongkak), baik hatinya; (3) tidak mulia (budi hati), hina, aib, nista; (4) tidak mahal (harga), murah; (5) tidak banyak, kecil, sedikit (pendapatan dll); (6) (taraf) permulaan; (7) tidak tinggi atau tidak penting (kedudukan, pangkat, dll), tidak istimewa, kecil; (8) kurang baik (mutu dll); (9) tidak maju lagi; (KD IV, 2007: 1313) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 17 17 8/2/16 11:17 AM se.pak bo.la n Olr permainan beregu di lapangan, menggunakan bola sepak dr dua kelompok yg berlawanan yg masing-masing terdiri atas sebelas pemain, berlangsung selama 2 X 45 menit, kemenangan ditentukan oleh selisih gol yg masuk ke gawang lawan; (KBBI IV, 2008: 1278) te.nis n permainan olahraga yg menggunakan bola (sebesar kepalan) sbg benda yg dipukul dan raket sbg pemukulnya, dimainkan oleh dua pemain (dua pasang), di lapangan yg dibatasi oleh jaring setinggi kira-kira satu meter (KBBI IV, 2008: 1442) Ketiga cabang olahraga di atas ditandai secara berbeda. Pada bulu tangkis dan tenis masing-masing ditandai dengan cabang olahraga dan permainan olahraga, sementara penanda tersebut pada sepak bola dinyatakan dengan singkatan Olr. Seharusnya, demi ketaatasasan, singkatan Olr itu digunakan juga pada bulu tangkis dan tenis. Di samping ketaatasan seperti yang dimaksudkan di atas, pencantuman beberapa cabang olahraga berikut ini perlu dicermati lebih lanjut. ping·pong n tenis meja (KBBI IV, 2008: 1077) sepak raga permainan bola dr rotan yg dianyam yg menggunakan tendangan kaki dan kepala; (KBBI IV, 2008: 1278) sepak takraw sepak raga; (KBBI IV, 2008: 1278) te·nis /ténis/ n permainan olahraga yg menggunakan bola (sebesar kepalan) sbg benda yg dipukul dan raket sbg pemukulnya, dimainkan oleh dua pemain (dua pasang), di lapangan yg dibatasi oleh jaring setinggi kira-kira satu meter: setiap minggu pagi ayah bermain --; -- meja permainan olahraga yg menggunakan bola pingpong dan bet (berlapis karet) sbg pemukulnya dan meja yg dirancang khusus sbg lapangannya (KBBI IV, 2008: 1442) vo.li n 1. bola voli; 2 bola yang terbang atau melayang sebelum menyentuh tanah (spt dl bola poli atau tenis); 3 tendangan atau pukulan (dl sepak bola, bola voli) sebelum bola menyentuh tanah; (KBBI IV, 2008: 1550) bo·la n 1 benda bulat yg dibuat dr karet dsb untuk bermain-main: ia senang sekali bermain-main dng --; 2 barang yg bentuknya menyerupai bulatan -- voli Olr 1 bola yg digunakan dl permainan olahraga bola voli; 2 permainan bola voli (KBBI IV, 2008: 204) Dari kutipan tentang beberapa nama cabang olahraga di atas, ada tiga hal yang perlu dicatat. Pertama, tentang pingpong dan tenis meja pilihannya sudah sesuai dengan cara kerja leksikograis : yang diberi takrif ialah tenis meja, bukan pingpong. Hampir semua orang tahu bahwa nama induk organisasinya ialah Persatuan Tenis Meja Seluruh Indonesia atau PTMSI (bukan PPSI atau Persatuan Pingpong Seluruh Indonesia). Kedua, sepak raga dan sepak takraw yang kedua-duanya dicantumkan sebagai sublema dari lema sepak. Yang benar dan resmi penggunaannya ialah sepak takraw, bukan sepak raga. Induk olahraganya bernama Persatuan Sepak Takraw Seluruh Indonesia 18 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 18 8/2/16 11:17 AM (PSTI), bukan Persatuan Sepak Raga Seluruh Indonesia (PSRI). Dengan demikian, pemberian takrifnya bukan pada sepak raga, tetapi seharusnya pada sepak takraw. Ketiga, pencantuman bola voli baik sebagai sublema dari lema bola maupun sebagai lema, kedua cara itu tidak menyalahi kaidah leksikograis. Sehubungan dengan hal itu, ketaatasasan dalam arti yang luas harus benar-benar dijadikan sebagai pemandu utama di dalam merumuskan atau mendeskripsikan makna. Oleh karena itu, pada Edisi III ketaatasasan perumusan makna itu diupayakan agar tetap terjaga, terutama untuk lema/sublema yang sudah pasti memiliki ciri makna yang sama, seperti pada 1. 2. 3. 4. 5. 6. penyebutan bilangan: puluh, ratus, ribu, dst. nama hari: Ahad, Kamis, Sabtu, dst. nama bulan tahun Masehi: Januari, Februari, Maret, dst. nama bulan tahun Kamariah: Muharam, Safar, Rabiulawal, dst. nama Zodiak: Akuarius, Aries, Leo, dst. satuan berat: gram, ons, ton, dst. Mengenai hal itu, pada bagian akhir paparan tentang pemerian makna ini dicontohkan beberapa rumusan yang didasarkan pada ketaatasasan tersebut. Bilangan ra·tus n satuan bilangan kelipatan seratus yg dilambangkan dng dua nol (00) di 1 belakang angka 1—9; (KBBI IV, 2008: 1147) ri·bu n satuan bilangan kelipatan seribu yg dilambangkan dng tiga nol (000) di belakang angka 1—999: tiga --;(KBBI IV, 2008: 1173) ju·ta n satuan bilangan kelipatan sejuta yg dilambangkan dng enam nol (000.000) di belakang angka 1 s.d. 999; (KBBI IV, 2008: 595) Nama Hari Se.nin n hari ke-2 dl jangka waktu satu minggu (KBBI IV, 2008: 1273) Sab.tu n hari ke-7 dl jangka waktu satu minggu (KBBI IV, 2008: 1197) Satuan Berat ki.lo.gram n satuan ukuran berat (massa) 1.000 g (disingkat kg) (KBBI IV, 2008: 699) ton n satuan ukuran berat 1.000 kg (KBBI IV, 2008: 1479) Nama Bulan Tahun Masehi Ja.nu.a.ri n bulan pertama tahun Masehi (31 hari) (KBBI IV, 2008: 567) Agus.tus n bulan ke-8 tahun Masehi (31 hari) (KBBI IV, 2008: 18) Nama Bulan Tahun Kamariah: Mu ha·ram n bulan pertama tahun Hijriah (KBBI IV, 2008: 934) Ra·bi·ul·a·wal n bulan ke-3 tahun Hijriah (30 hari); bulan Maulid (KBBI IV, 2008: 1127) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 19 19 8/2/16 11:17 AM Nama Zodiak A.ries /Ariés/ n 1 Astron nama gugus bintang di belahan langit sebelah utara khatulistiwa; 2 Astrol Ari·es zodiak pertama yg digambarkan dng domba jantan sbg lambang bagi orang yg lahir antara tanggal 21 Maret dan 19 April; Mesa; Hamal (KBBI IV, 2008: 85) Leo /Léo/ n 1 cak singa; 2 Astron nama bintang di belahan langit sebelah utara khatulistiwa; 3 Astrol lambang ke-5 zodiak yg digambarkan dng singa sbg lambang bagi orang yg dilahirkan antara tanggal 23 Juli—22 Agustus (KBBI IV, 2008: 817) Vir·go n 1 Astron nama gugus bintang yg terletak di antara Leo dan Libra pd deklinasi 00; 2 Astrol zodiak ke-6 yg digambarkan dng wanita kembar sbg lambang bagi orang lahir antara tanggal 23 Agustus—22 September; Kanya; Mayang; Sunbulat (KBBI IV, 2008: 1548) Daftar Pustaka Alwi Hasan, “Bahasa Indonesia dan Bahasa Melayu” Sekelumit Catatan”, Makalah Konvensi Bahasa dan Budaya dengan tema “Jejak Raja Ali Haji dalam Bahasa Media” dalam rangka kegiatan Hari Pers Nasional (HPN) 2015 yang dipusatkan di Provinsi Kepulauan Riau (Kepri) pada tanggal 5--9 Februari 2015. Dewan Bahasa dan Pustaka, 2007, Kamus Dewan Edisi Keempat, Kuala Lumpur: Dewan Bahasa dan Pustaka Pusat Bahasa, Departemen Pendidikan Nasional, 2008, Kamus Besar Bahasa Indonesia Edisi Keempat, Jakarta: PT Gramedia Pustaka Utama (http://lifestyle.okezone.com/read/2014/05/19/482/986931/pria-pendek-tak-perlu-minderanda-lebih-panjang-umur) (http://www.utusan.com.my/gaya-hidup/keluarga/tubuh-berhenti-meninggi-1.24161) 20 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 20 8/2/16 11:17 AM Kamus sebagai Kitab Undang-Undang Deny A. Kwary, Ph.D. Universitas Airlangga [email protected] Abstrak Di beberapa negara yang memiliki kajian leksikograi yang cukup maju, banyak peneliti dan institusi yang telah memberikan perhatian besar terhadap perkembangan kamus. Hal ini berbeda dengan keadaan di Indonesia. Perkamusan di Indonesia nampaknya masih kurang berkembang dan kurang mendapatkan perhatian serius dari para peneliti dan institusi. Berbagai penelitian di negara-negara lain telah menunjukkan peran penting kamus di berbagai bidang, termasuk dalam pengambilan keputusan hukum. Dalam makalah ini, kamus diusulkan untuk dapat disejajarkan dengan kitab undangundang. Kamus yang disusun dengan serius dan dengan prinsip leksikograi yang tepat akan menghasilkan rujukan yang sahih dan berkualitas. Untuk mencapai tujuan tersebut, perlu ada itur-itur khusus yang dimasukkan ke dalam entri sehingga kamus tersebut dapat menjadi rujukan dalam memutuskan kasus hukum. Kata kunci: kamus hukum; kamus umum; deinisi; makna kata; entri kamus I. PENDAHULUAN Di beberapa negara, meskipun sudah tersedia kamus hukum, kamus umum tetap dijadikan rujukan dalam beberapa kasus hukum. Hal ini terkait dengan kenyataan bahwa kasus hukum cukup sering melibatkan permasalahan makna kata umum, bukan kata yang khusus berkaitan dengan ilmu hukum. Calhoun (2014: 248) mencatat bahwa di Amerika Serikat terdapat peningkatan penggunaan kamus umum di pengadilan selama dua puluh lima tahun terakhir ini. Pada tahun 2010, Pengadilan Tinggi (Supreme Courts) mengutip kamus empat kali lebih banyak dari pada di tahun 1985. Pengadilan cukup Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 21 21 8/2/16 11:17 AM banyak merujuk pada kamus umum karena penggunaan suatu kata di dalam produk hukum atau kasus hukum mengacu pada makna kata tersebut secara umum. Berdasarkan data yang dikumpulkan oleh Brudney dan Baum (2013: 529), selama tahun 1986-2010, menunjukkan bahwa kamus umum adalah yang paling banyak dirujuk (74%), kamus hukum hanya dirujuk 45%, dan kamus kosakata teknis (misalnya kamus Akuntansi) hanya dirujuk 6% dari semua kasus hukum yang ada. Secara lebih rinci lagi, 21% pendapat mengutip kamus umum dan kamus hukum, 53% hanya kamus umum namun tidak kamus hukum, dan 24% hanya kamus hukum namun tidak kamus umum. Dengan demikian, dapat dikatakan bahwa lebih dari separuh kasus hukum hanya mengutip kamus umum. Hal ini menunjukkan peran penting kamus umum dalam dunia peradilan, khususnya di Amerika Serikat. Data lebih lanjut menunjukkan bahwa ada empat kamus umum yang paling sering dirujuk, yaitu Webster’s Third New International Dictionary (36%), the Oxford English Dictionary (20 percent), Webster’s Dictionary Second Edition (19 percent), and the American Heritage Dictionary of the English Language (15 percent). Di Indonesia, beberapa hakim dan pengacara sudah mulai merujuk pada kamus umum, khususnya Kamus Besar Bahasa Indonesia (KBBI). Sebenarnya KBBI (hingga edisi ke empat) masih kurang tepat untuk dijadikan rujukan mengenai makna kata, karena berbagai hal. Salah satunya adalah entri yang terlalu singkat, misalnya lema kepala yang hanya dideinisikan dengan sinonim, tanpa penjelasan dan contoh penggunaan. Sinonim kurang tepat digunakan untuk mendeinisikan lema di kamus besar, khususnya jika ingin dijadikan rujukan hukum, karena tidak ada dua kata yang maknanya persis sama. Dengan kata lain, tidak pernah ada sinonim seluruh (true synonyms). Setiap kata pasti memiliki perbedaan, meskipun kecil, dengan kata lain dalam hal makna dan penggunaannya. Oleh karena itu, jika kita ingin membuat kamus yang bisa dijadikan rujukan dalam kasus hukum, kamus yang kita buat harus memiliki itur-itur yang dibutuhkan dalam menyelesaikan kasus hukum. Pembahasan dalam makalah ini dibagi dalam dua bagian utama. Bagian pertama membahas salah satu contoh kasus hukum yang melibatkan penafsiran makna suatu kata umum. Bagian kedua merumuskan usulan mengenai itur-itur yang perlu ada dalam kamus yang bisa berfungsi sebagai kitab undang-undang kata. II. CONTOH KASUS HUKUM YANG MELIBATKAN KAMUS UMUM Salah satu kasus hukum yang melibatkan makna kata dan cukup populer adalah kasus pengadilan federal antara Kuzmanovski dan New South Wales Lotteries Corporation pada tahun 2010 (The Australian Professional Liability Blog, 19 Oktober 2010). Keputusan apakah penggugat bisa memenangkan 100.000 dolar Australia bergantung pada apakah kata bathe berarti berenang. Penggugat merasa telah memenangkan lotere 22 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 22 8/2/16 11:17 AM karena mendapatkan kata BATHE yang berkaitan dengan gambar orang berenang. Akan tetapi, perusahaan lotere menganggap bahwa kata BATHE tidak sama artinya dengan berenang. Potongan dari lotere tersebut dapat dilihat di Gambar 1. Gambar 1. Potongan lotere kasus makna kata Dari potongan lotere yang ditunjukkan di Gambar 1, kita bisa melihat di ujung kiri bawah terdapat kata BATHE dengan hadiah sebesar 100.000 dolar Australia jika kata tersebut sesuai dengan gambar di bawahnya. Pada gambar di bawah kata tersebut, terlihat gambar orang berenang dan kata swim. Dengan demikian, jika bathe memiliki makna yang sama dengan swim, pemilik lembar lotere tersebut akan memenangkan 100.000 dolar Australia. Akan tetapi, perusahaan lotere menyatakan bahwa kata bathe tidak memiliki makna yang sama dengan swim. Kasus ini kemudian dibawa ke pengadilan. Pihak perusahaan lotere menjelaskan pendapatnya dengan mengutip Macquarie Dictionary yang menyebutkan bahwa kata bathe hanya bermakna swim dalam bahasa Inggris Britania (chiely British). Dengan demikian, bathe tidak bermakna swim dalam bahasa Inggris Australia. Untuk menyangkal pendapat tersebut, hakim yang bertugas saat itu mengutip deinisi kata bathe dengan pemarkah taktransitif dari empat kamus, sebagai berikut: • Collins English Dictionary (edisi ketiga) (Konsultan Khusus Australia: G.A. Wilkes dan W.A. Krebs): makna pertamanya adalah “to swim or paddle in a body of open water or a river”. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 23 23 8/2/16 11:17 AM • • • Australian Concise Oxford Dictionary of Current English (edisi ketiga): makna pertamanya adalah “immerse oneself in water; exp to swim”. Collins Australian Dictionary (edisi kedelapan) yang awalnya dikutip oleh Kuzmanovski (sebagai penggugat): makna pertamanya adalah “swim in open water for pleasure”. New Shorter Oxford English Dictionary (Volume 1; 1993): makna keempatnya (yang merupapkan makna pertama dengan pemarkah taktransitif) adalah “Immerse oneself in water, esp in the sea, a river, a swimming pool etc, for recreation”. Entri kamus ini juga menyebutkan sublema bathing beauty dengan deinisi an attractive woman in a swimsuit, dan sublema bathers (esp Austral.) yang dideinisikan swimtrunks, a swimming costume. Ke empat deinisi di atas menunjukkan bahwa kata bathe memang bisa dianggap berkaitan dengan gambar orang berenang dan kata swim. Untuk menanggapi pendapat hakim yang mengutip deinisi dari empat kamus di atas, pihak perusahaan lotere menyatakan bahwa tetap ada perbedaan antara bathe dan swim dalam konsep makna. Perusahaan lotere ini menyampaikan bahwa makna utama dari swim adalah menggerakkan tubuh melalui air (propel the body through water), sedangkan bathe hanya bermakna memasukkan tubuh ke air (immersing the body in water). Tanggapan tersebut juga dibantah oleh hakim, karena inti dari permainan lotere tersebut adalah apakah kata bathe sesuai dengan gambar orang berenang. Makna kata swim bukan bagian dari permainan lotere ini. Dengan demikian, hakim memutuskan untuk memenangkan penggugat, yaitu Kuzmanovski, dan meminta New South Wales Lotteries Corporation untuk membayar sesusai tuntutan Kuzmanovski. III. FITUR ENTRI KAMUS SEBAGAI KITAB UNDANG-UNDANG Beberapa kritikus telah menyampaikan permasalahan mengenai kamus umum yang seharusnya digunakan sebagai rujukan dalam kasus hukum. Jika hakim hanya menggunakan satu kamus, kemungkinan deinisi yang dipilih akan memberatkan salah satu pihak. Jika ada beberapa kamus yang digunakan, kemungkinan ada pertentangan juga dalam deinisinya. Hingga saat ini, kamus umum memang dibuat bukan untuk menjadi rujukan di pengadilan. Secara tradisional, kamus dibuat untuk memberikan informasi mengenai makna kata. Dalam perkembangan selanjutnya, kamus dibuat berdasarkan kebutuhan pengguna sasaran. Dengan demikian, jika kita ingin membuat kamus yang bisa dijadikan rujukan di pengadilan atau kamus yang bisa dijadikan Kitab Undang-undang Hukum Kata (agar sejajar dengan rujukan lain yang digunakan dalam kasus hukum, misalnya Kitab Undang-undang Hukum Pidana), ada beberapa itur yang perlu dimasukkan ketika menyusun entri kamus tersebut. Fitur suatu entri atau struktur internal entri kamus bervariasi antara satu kamus dengan kamus yang lain. Hanks (2006) menyebutkan delapan itur atau unsur yang 24 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 24 8/2/16 11:17 AM umumnya ada di dalam entri kamus, yaitu lema kepala, pengucapan, gramatika, deinisi, contoh, frasa, penggunaan, dan etimologi. Untuk kamus yang bisa digunakan sebagai rujukan di pengadilan, dalam makalah ini diusulkan minimal ada enam itur, yaitu lema, informasi gramatika, deinisi, contoh penggunaan, label, dan masa berlaku. 3. 1. Lema Kamus untuk fungsi reseptif biasanya memiliki lebih banyak lema (lema kepala dan sublema) daripada kamus untuk fungsi produktif. Oleh karena fungsi utama kamus ini adalah reseptif, maka lema kepala yang dimasukkan sebisa mungkin mencakup semua jenis butir leksikal (lexical item). Atkins dan Rundell (2008: 164) membagi jenis butir leksikal ke dalam empat kelompok, yaitu: kata sederhana, singkatan, kata parsial, dan kata rangkap (multiword expressions). Ke empat kelompok butir leksikal tersebut perlu dimasukkan sebagai lema kepala atau sublema di kamus ini. 3. 2. Informasi Gramatika Lema kepala dan sublema perlu disertai dengan informasi gramatika yang bisa menunjukkan perbedaan makna. Informasi ini bisa mencakup kelas kata, transitivitas, kolokasi, dll. Informasi kelas kata diperlukan karena suatu kata bisa memiliki makna yang berbeda jika kelas katanya berbeda. Informasi transitivitas diperlukan jika makna suatu kata bisa berbeda jika digunakan dalam bentuk transitif dan taktransitif. Contohnya adalah kata bathe di kasus yang dibahas sebelumnya. Makna kata bathe sebagai verba transitif agak berbeda dari makna kata bathe sebagai verba taktransitif. Menurut Oxford Advanced Learner’s Dictionary edisi kesembilan (OALD9), kata bathe sebagai verba transitif berarti to wash something with water, especially a part of your body; sedangkan sebagai verba taktransitif deinisinya adalah to go swimming in the sea, a river, etc. for enjoyment. Hal tersebut menunjukkan bahwa informasi transitivitas bermanfaat dalam menentukan makna kata. Pola kolokasi, jika membedakan makna kata, juga perlu dimasukkan. Contohnya verba hump. OALD9 menyebutkan bahwa jika verba hump diikuti oleh something, maknanya adalah to carry something heavy (mengangkat sesuatu yang berat); sedangkan jika diikuti oleh someone, maknanya adalah to have sex with somebody (melakukan hubungan badan dengan seseorang). 3. 3. Deinisi Ada beberapa cara untuk menulis deinisi suatu kata, misalnya dengan menggunakan genus-diferensia dan sinonim. Dalam perkembangan lebih lanjut, Sinclair (1987) mengusulkan cara pendeinisian yang disebut FSD (full sentence deinition ‘deinisi kalimat lengkap’). Cara pendeinisian ini cukup banyak dikritik karena membuat entri kamus menjadi lebih panjang. Untuk kamus ini, deinisi yang lebih panjang itulah yang dibutuhkan. Bahkan, alih-alih menyebutnya deinisi, kita bisa menyebutnya penjelasan. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 25 25 8/2/16 11:17 AM Jika kita kembali ke kamus COBUILD (1987), di bagian petunjuk penggunaan kamus ini ada subjudul Explanation of meaning and use (‘penjelasan makna dan penggunaan’), dan tidak ada kata ‘deinisi’. Penggunaan kata ‘penjelasan’, alih-alih kata ‘deinisi’, sebenarnya sudah disebutkan juga jauh sebelumnya oleh Samuel Johnson di bagian Prakata dari Dictionary of the English Language (1755). Dalam makalah ini, kata ‘deinisi’ dan ‘penjelasan’ untuk lema atau suatu kata akan digunakan secara bergantian, namun merujuk pada hal yang sama. Seperti yang disebutkan dalam subbagian penjelasan mengenai lema, fungsi utama dari kamus ini adalah reseptif. Akan tetapi, dalam pembuatan deinisi, kita sebaiknya tidak mengikuti prinsip pembuatan deinisi seperti yang digunakan di kamus reseptif. Secara prinsip, deinisi di kamus reseptif bertujuan untuk menyediakan petunjuk dan asosiasi yang mengaitkan sesuatu (kata) yang tidak diketahui dengan sesuatu yang diketahui (Bolinger 1965: 572). Cara ini akan memungkinkan pengguna kamus untuk mengetahui makna dari suatu kata yang dicari di kamus. Akan tetapi, pengguna kamus tidak akan mengetahui penggunaan kata tersebut. Oleh karena itu, di kamus ini, meskipun fungsi utamanya adalah reseptif, cara penulisan deinisinya mengacu pada fungsi produktif. Salah satu contoh penerapannya adalah pada kata bahasa Inggris carrion yang disebutkan oleh Fillmore (2003). Kamus yang menggunakan deinisi dengan fungsi reseptif, akan mendeinisikan kata carrion sebagai berikut: the rotting meat of a dead animal (‘daging yang sudah membusuk dari hewan yang sudah mati’). Deinisi tersebut bisa memenuhi kebutuhan pengguna untuk mengetahui makna kata carrion. Dengan kata lain, fungsi reseptif telah terpenuhi. Akan tetapi, jika kita ingin menggunakan kata tersebut secara produktif dalam konteks yang tepat, perlu ada penjelasan lebih lanjut. Kata carrion tidak berlaku untuk daging yang membusuk di dalam kulkas, dan juga tidak berlaku untuk daging hewan yang tidak sengaja terinjak ketika seseorang berada di hutan. Oleh karena itu, perlu ada penjelasan tambahan bahwa carrion hanya digunakan untuk makanan dari hewan pemakan bangkai. Informasi semacam ini juga diperlukan untuk kamus yang akan digunakan untuk rujukan di pengadilan. Jadi, pemilihan lema kamus ini merujuk pada fungsi reseptif, namun penulisan deinisinya merujuk pada fungsi produktif. 3. 4. Contoh penggunaan Kamus untuk fungsi reseptif tidak terlalu banyak menggunakan contoh penggunaan. Akan tetapi, untuk kamus ini, penyediaan contoh penggunaan sangat disarankan. Contoh penggunaan merupakan landasan untuk mendeskripsikan suatu kata dan menjadi bukti cara penggunaan kata tersebut oleh suatu masyarakat (Atkins dan Rundell 2008: 2). Oleh karena itu, contoh yang otentik perlu digunakan, bukan contoh yang dikarang oleh leksikografer. Dalam hal ini, disarankan mengikuti penggunaan contoh di Oxford English Dictionary. Semua contoh penggunaan kata di entri kamus tersebut diambil dari teks otentik untuk menunjukkan secara objektif bahwa kata tersebut dan makna yang disebutkan memang ditemukan dalam bahasa tersebut (Simpson 2003: 268). 26 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 26 8/2/16 11:17 AM 3. 5. Label Selain deinisi dan contoh penggunaan, kita juga perlu menggunakan label sebagai pemarkah penggunaan suatu kata. Kata-kata yang tidak diberi label akan dianggap sebagai kata yang memiliki penggunaan standard (Kipfer 1984: 140). Atkins dan Rundell (2008: 228-231) menyebutkan delapan jenis label yang biasanya digunakan di dalam kamus. Dari delapan jenis label tersebut, tujuh di antaranya relevan untuk dimasukkan ke dalam kamus yang akan berfungsi sebagai kitab undang-undang kata. Label mengenai waktu penggunaan, yang menunjukkan apakah suatu kata sudah obsolet atau belum, tidak perlu dimasukkan sebagai label, namun dimasukkan dalam itur yang dijelaskan di subbab 3.6. dalam makalah ini. Penjelasan mengenai tujuh label yang dimasukkan ke dalam kamus ini adalah sebagai berikut: • • • • • Label domain: Label ini menunjukkan bidang ilmu atau bidang khusus, misalnya teknik, kedokteran, tenis, puisi, dll. Label ini penting karena suatu kata yang sama bisa memiliki makna yang berbeda di domain yang berbeda. Misalnya nomina love tidak bermakna cinta di domain tenis, melainkan skor nol. Label wilayah: Dalam bahasa Inggris, label wilayah sangat penting karena suatu kata mungkin hanya digunakan atau lebih sering digunakan di suatu wilayah tertentu, namun tidak di wilayah yang lain. Suatu kata juga bisa memiliki makna yang berbeda di wilayah yang berbeda. Contohnya makna kata hotel dalam bahasa Inggris Australia bisa berarti pub, dan dalam bahasa Inggris India bisa berarti restoran. Di Indonesia, label wilayah ini juga penting karena negara Indonesia memiliki berbagai bahasa daerah yang masing-masing memberikan kontribusi ke bahasa Indonesia. Label register: Label ini memiliki berbagai fungsi, misalnya penanda formalitas, penanda slang, dll. Kamus sebagai kitab undang-undang kata perlu memiliki label register karena makna suatu kata bisa berbeda pada register yang berbeda. Misalnya kata acid yang secara umum berarti ‘senyawa kimia/asam’, memiliki makna obatobatan terlarang jika diberi label slang (lihat OALD9). Label genre: Label ini menunjukkan penggunaan kata pada genre tertentu (misalnya karya sastra, surat kabar, dll.). Contohnya kata cunning. Kata tersebut umumnya merujuk pada seseorang yang pandai menipu. OALD9 mendeinisikannya able to get what you want in a clever way, especially by tricking or cheating somebody (‘bisa memperoleh apa yang diinginkan dengan cara yang cerdik, khususnya dengan cara mencurangi atau menipu seseorang’). Akan tetapi, di genre karya sastra menurut OED2, cunning berarti knowledge how to do a thing; ability, skill, expertness, dexterity, cleverness (‘pengetahuan mengenai cara melakukan sesuatu; kemampuan, keterampilan, keahlian, kecekatan, dan kepandaian’). Label sikap. Label ini menunjukkan apakah suatu kata memiliki makna yang disetujui atau tidak disetujui (approval atau disapproval). Contohnya kata snazzy Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 27 27 8/2/16 11:17 AM • dan jazzy. Kedua kata tersebut memiliki makna yang sama, yaitu ‘bergaya yang menarik perhatian’. Akan tetapi, snazzy memiliki label approval (lihat CALD3), dan jazzy memiliki label disapproving (lihat OALD9). Label jenis makna. Label ini menyatakan apakah suatu kata perlu dimaknai secara iguratif atau tidak. Misalnya kata screech. Menurut CALD3, makna dasar dari kata ini adalah to make an unpleasant loud high noise (‘membuat suara yang gaduh’), namun jika diberi label iguratif, maknanya menjadi stop very suddenly (‘berhenti mendadak’). 3. 6. Masa berlaku Kamus pemelajar biasanya hanya berisi kata dan makna kata yang masih digunakan di masyarakat. Hal ini berbeda dari kamus umum yang mencatat semua kata dan makna kata yang masih digunakan dan yang sudah tidak digunakan. OED2 menggunakan simbol salib untuk menyatakan bahwa suatu kata atau makna kata sudah tidak digunakan lagi. Cara tersebut kurang spesiik karena kita tidak mengetahui secara jelas kapan makna kata tersebut tidak digunakan lagi. Misalnya, jika seseorang dituntut karena menyebut orang lain gay, kita perlu mengetahui kapan sebutan tersebut disampaikan dan kapan makna gay berubah. Kata gay bisa berarti ‘homoseksual’, namun juga bisa berarti ‘riang gembira’ (happy and full of fun). OALD9 hanya memberikan label old-fashioned untuk kata gay yang berarti happy and full of fun. Pemberian rincian tahun penggunaan akan sangat membantu hakim memutuskan apakah dalam kasus di atas telah terjadi pencemaran nama baik atau tidak. Untuk kamus yang berfungsi sebagai kitab undang-undang, kita perlu menyediakan informasi masa berlaku, yaitu kapan suatu makna mulai berlaku pada suatu kata, dan kapan makna tersebut tidak digunakan lagi. IV. SIMPULAN Berdasarkan pembahasan di atas, dapat disimpulkan bahwa kamus sebenarnya bisa dijadikan kitab undang-undang hukum. Akan tetapi, perlu ada penyesuaian dalam informasi yang disediakan di kamus tersebut. Misalnya, meskipun fungsi kamus ini adalah reseptif dan pemilihan lema juga merujuk pada prinsip yang diterapkan pada kamus dengan fungsi reseptif, namun pembuatan deinisi harus merujuk pada prinsip yang diterapkan pada kamus dengan fungsi produktif. Di makalah ini, diusulkan agar kamus ini minimal memiliki enam itur pada struktur internal entrinya, yaitu lema, informasi gramatika, deinisi, contoh penggunaan, label, dan masa berlaku. 28 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 28 8/2/16 11:17 AM Daftar Pustaka AHD – American Heritage Dictionary of the English Language. 1982. Boston: Houghton Miflin. Atkins, B. T. S. dan Rundell, M. 2008. The Oxford Guide to Practical Lexicography. Oxford: Oxford University Press. Australian Concise Oxford Dictionary of Current English (edisi 3). 1987. Oxford: Oxford University Press. Bolinger, D. 1965. The Atomization of Meaning. Language 41: 555–573. Brudney, J. J. dan Baum, L. 2013. Oasis or Mirage: The Supreme Court’s Thirst for Dictionaries in the Rehnquist and Roberts Eras. William & Mary Law Review 55(2): 483-580. CALD3 – Cambridge Advanced Learner’s Dictionary. 2008. Cambridge: Cambridge University Press. Calhoun, J. 2014. Measuring the Fortress: Explaining Trends in Supreme Court and Circuit Court Dictionary Use. Yale Law Journal 124(2): 284-526. Collins Australian Dictionary (edisi 8). 2005. Sydney: HarperCollins. Collins English Dictionary (edisi 3). 2004. Glassgow: HarperCollins. Fillmore, C. J. 2003. Double-decker Deinitions: the Role of Frames in Meaning Explanations. Sign Language Studies 3(3): 263–295. Hanks, P. 2006. Lexicography: Overview. Dalam Encyclopedia of Language and Linguistics. Elsevier. KBBI – Kamus Besar Bahasa Indonesia. 2008. Jakarta: Gramedia Pustaka Utama. Kipfer, B. A. 1984. Workbook on Lexicography. Exeter: University of Exeter. Macquarie Dictionary. 1982. Sydney: Macquarie Library. New Shorter Oxford English Dictionary. 1993. Oxford: Oxford University Press. OED2 – Oxford English Dictionary (edisi 2). 1989. Oxford: Oxford University Press. OALD9 – Oxford Advanced Learner’s Dictionary (edisi 9). 2015. Oxford: Oxford University Press. Simpson, J. 2003. The Production and Use of Occurrence Examples. Dalam P. van Sterkenburg (ed.). A Practical Guide to Lexicography. Amsterdam: John Benjamins. 260–272. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 1-4.indd 29 29 8/2/16 11:17 AM Sinclair, J. M. 1987. Looking Up: An Account of the COBUILD Project in Lexical Computing. London: Collins. The Australian Professional Liability Blog, 19 Oktober 2010. Webster’s Dictionary (edisi 2). 1939. Springield: G. & C. Merriam Co. Webster’s Third New International Dictionary. 1961. Springield: G. & C. Merriam Co. 30 Prosiding Seminar Leksikograi Indonesia PROSIDING 1-4.indd 30 8/2/16 11:17 AM Pemanfaatan Korpus dalam Analisis Makna Kata Bersinonim mau, ingin, hendak, dan akan Dewi Puspita Pusat Pengembangan dan Pelindungan Badan Pengembangan dan Pembinaan Bahasa [email protected] Abstrak Linguistik korpus sudah lama digunkan untuk membantu penyusunan kamus berbahasa Inggris, khususnya dalam pendeinisian lema karena selain dapat memberi deinisi yang lebih subjektif, korpus juga dapat memberikan data faktual tentang sebuah kata. Data tersebut dapat juga digunakan untuk membedakan dua atau lebih kata yang berdekatan makna. Sayangnya, lemalema dalam Kamus Besar Bahasa Indonesia masih dideinisikan berdasarkan intuisi penyusunnya, belum dengan bantuan korpus. Makalah ini akan mengulas pendeinisian kata bersinonim mau, ingin, hendak, dan akan dalam Kamus Besar Bahasa Indonesia edisi 4 dengan menggunakan pendekatan korpus linguistik. Dengan menggunakan korpus bahasa Indonesia berbasis web dan kompilasi berbagai teks, hasil analisis dari penelitian ini diharapkan dapat digunakan untuk membantu pemutakhiran Kamus Besar Bahasa Indonesia. I. PENDAHULUAN Latar belakang penulisan makalah ini sebenarnya adalah rasa ketidaknyamanan saya ketika mendengar anak saya bercerita bahwa temannya “ingin” jatuh pada saat ia tidak dapat mengendalikan sepedanya. Spontan saya mengoreksinya dengan mengatakan bahwa yang betul adalah “mau jatuh” bukan “ingin jatuh”. Anak saya kemudian bertanya “apa bedanya?” Pada saat itu saya menjawab, “ingin” muncul dari diri sendiri, sedangkan “mau” adalah sesuatu yang akan terjadi. Tentu saja jawaban saya tadi adalah jawaban yang didasarkan pada pengetahuan dan nilai rasa pribadi terhadap kedua kata itu, Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 31 31 8/2/16 11:19 AM sehingga jawabannya sangat subjektif. Orang lain, termasuk anak saya sendiri, mungkin mempunyai persepsi lain mengenai deinisi kata tersebut. Kami lalu mencoba mencari makna kedua kata tersebut dalam KBBI. Kamus Besar Bahasa Indonesia Edisi Keempat mendeinisikan ingin dan mau sebagai berikut. ingin adv hendak; mau; berhasrat: dia -- mencoba apakah telur merpati juga enak dimakan (2008; 536) mau 1 adv sungguh-sungguh suka hendak; suka akan; sudi: ia -- datang kalau dijemput; 2 adv akan; hendak: ibu -- berangkat ke Surabaya; 3 n kehendak; maksud: apa --mu datang ke sini?; --nya begini (2008; 890) Merujuk pada deinisi seperti yang disajikan di atas, pemahaman saya mengenai kata ingin sepertinya sudah tepat, yaitu ‘berhasrat’, begitu pula dengan pemahaman saya tentang kata mau yang dideinisikan dengan ‘akan’ dan ‘hendak’, bukan dengan ‘ingin’. Namun, pertanyaan selanjutnya muncul ketika saya kemudian juga memeriksa deinisi kata hendak dan akan di kamus yang sama seperti berikut. hendak adv mau; akan; bermaksud akan: pamannya -- hendak pergi jauh; ia -- mengadakan pesta pernikahan (2008; 491) 1 akan adv (untuk menyatakan sesuatu yg hendak terjadi, berarti) hendak: disangkanya hari – hujan (2008; 25) Jika ingin, mau, dan akan dideinisikan dengan ‘hendak’ sedangkan deinisi dari hendak adalah ‘mau’ dan ‘akan’, lalu apa perbedaan dari keempat kata tersebut? Dari situlah, ide untuk menganalisis kata-kata tersebut kemudian muncul. Bagaimanapun, pasti ada perbedaan makna dari setiap kata yang bersinonim mengingat sinonim mutlak sangatlah sedikit (Cruse, 2004). Penelitian kecil yang terangkum dalam makalah ini dilakukan untuk mendapatkan jawaban dari pertanyaan-pertanyaan di atas. Lebih jelasnya, tujuan dari kajian ini adalah untuk mengetahui perbedaan makna mau, ingin, hendak, dan akan berdasarkan data korpus yang hasilnya diharapkan dapat memberi pencerahan bagi pengguna bahasa juga untuk membantu perbaikan deinisi keempat kata tersebut (jika ada) dalam Kamus Besar Bahasa Indonesia. Selain itu, kajian ini juga bermaksud untuk menunjukkan bagaimana data korpus dan pendekatan linguistik korpus dapat digunakan untuk mendeinisikan sebuah kata pada khususnya dan membantu penyusunan kamus pada umumnya. Kajian ini akan dibatasi ruang lingkupnya pada empat kata bersinonim seperti yang telah disebutkan sebelumnya. Walaupun sebetulnya masih ada sinonim atau bentuk lain dari keempat kata yang dijadikan objek kajian, seperti bakal, pingin, kepingin, atau pengen (dalam bentuk cakapan). Bentuk turunan dari kata-kata tersebut, seperti kemauan, keinginan, atau kehendak juga tidak akan diikutsertakan dalam kajian ini. 32 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 32 8/2/16 11:19 AM Pusat Bahasa (2007) dalam Buku Praktis Bahasa Indonesia 2, Bab Pilihan Kata sudah banyak menerangkan perbedaan penggunaan kata-kata bersinonim. Di antara kata-kata bersinonim yang dijelaskan adalah masing-masing dan tiap-tiap, jam dan pukul, setengah dan separo, pertandingan dan perlombaan, di dan pada, serta sudah dan telah. Kata-kata yang bermiripan itu diterangkan persamaan dan perbedaannya secara semantik dan pragmatik disertai dengan contoh penggunaannya dalam kalimat. Penjelasan yang diberikan sudah cukup dapat dimengerti dan diterima, tetapi argumennya akan lebih kuat lagi jika didukung oleh data korpus. Sayangnya, keterangan mengenai persamaan dan perbedaan dari kata-kata bersinonim di atas tidak ditampilkan dalam deinisi entri kata tersebut dalam Kamus Besar Bahasa Indonesia yang juga terbitan Badan Bahasa. Mengenai persamaan dan perbedaan kata bersinonim sudah dan telah, Kaswanti (2011) telah lama mengkajinya. Penelitian tentang kedua kata tersebut telah dimulai sejak tahun 1978 dan masih berlanjut hingga saat ini. Pada awalnya, Kaswanti menggunakan metode pencatatan manual untuk setiap penggunaan kata sudah dan telah dalam konteks yang ditemui hingga akhirnya kini beliau menggunakan korpus. Sementara itu, kajian-kajian berbasis korpus untuk kata bersinonim dalam bahasa Inggris sudah banyak sekali dilakukan. Dalam kelas linguistik korpus yang pernah penulis ikuti, kajian kata bersinonim dengan pendekatan korpus bahkan dijadikan tugas akhir untuk mata kuliah tersebut. Mahasiswa diminta untuk memilih dua hingga lima kata atau frasa dan melakukan studi korpus dari kata atau frasa tersebut untuk mencari persamaan dan/atau perbedaannya dilihat dari berbagai sisi, baik sisi semantik, pragmatik, maupun tata bahasanya. Kata atau frasa bahasa Inggris yang sudah pernah dikaji sebelumnya diantaranya adalah between dan through; immense, enormous dan massive; reason to dan reason for; on the other hand dan on the contrary. Hasil yang didapat dari kajian-kajian di atas sebagian besar menunjukkan bahwa pendekatan korpus linguistik dapat secara efektif memperlihatkan pola persamaan dan/atau perbedaan dari kata-kata yang dijadikan objek kajian. II. KERANGKA TEORI DAN METODE PENELITIAN Penggunaan korpus untuk berbagai keperluan kebahasaan telah menjadi tren pada saat ini. Metode penganalisisan gejala-gejala linguistik dengan menggunakan korpus dikenal sebagai linguistik korpus. Beberapa akademisi menganggap linguistik korpus sebagai pendekatan teoretis untuk mempelajari bahasa (Tognini-Bonelli, 2001; Teubert, 2005; Gries, 2009; McEnery dan Hardie, 2012). Sebagai metodologi, karakteristik utama korpus linguistik terdapat pada pendekatan empirisnya, fokus pada data otentik, pendekatan makna, dan penggunaan perangkat digital untuk memproses data bahasa yang memberikan hasil yang objektif. Namun demikian, hasil yang diberikan oleh Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 33 33 8/2/16 11:19 AM perangkat korpus masih perlu ditafsirkan untuk dapat difahami. Ketika data-data tersebut ditafsirkan, pada saat itulah teori dan panduan hipotesis linguistik diperlukan (Hunston, 2002). Selain untuk pengajaran bahasa, korpus linguistik juga dapat diaplikasikan untuk penyusunan kamus, penerjemahan, analisis wacana, dan berbagai keperluan lainnya. Hunston (2002) menyatakan bahwa kontribusi utama korpus linguistik adalah di bidang pengajaran bahasa dan penerjemahan, aplikasi lainnya yaitu pada bidang leksikograi dan terminologi, studi ideologi dan budaya, karakterisasi register dan genre, serta di bidang linguistik forensik. Dalam penyusunan kamus, korpus dan linguistik korpus sangat membantu dalam proses pendeinisian terutama untuk mendeskripsikan kata sesuai dengan konteks yang ada dan digunakan oleh masyarakat. Korpus linguistik merupakan pendekatan lain yang lebih mutakhir dalam penyusunan kamus dan dianggap lebih faktual untuk dapat mengetahui makna sebuah kata. Hal tersebut juga berlaku untuk pendeinisian kata-kata bersinonim. Selama ini, metode yang biasa digunakan oleh para linguis untuk mengetahui perbedaan makna kata yang bersinonim dan mengetahui perbedaan ciri semantik antara satu kata dengan kata yang lain adalah metode analisis komponen (Subroto, 2011). Dengan mempertimbangkan beberapa keunggulan korpus dan linguistik korpus seperti yang telah disampaikan sebelumnya, metode yang digunakan dalam kajian ini adalah metode korpus karena dalam korpus terdapat sekumpulan data autentik dalam jumlah besar yang diharapkan dapat memberi informasi lebih jelas mengenai perbedaan makna kata yang bermiripan. Kajian ini akan menggunakan dua perangkat korpus. Data korpus pertama yang akan digunakan adalah data korpus bahasa Indonesia dari Leipzig Corpora yang dapat diakses secara bebas melalui jaringan internet dengan mengklik tautan berikut: http://corpora.unileipzig.de/en?corpusId=ind_mixed_2013. Data korpus bahasa Indonesia yang terdapat dalam Leipzig Corpora berisi teks-teks berbahasa Indonesia yang diambil dari web pada tahun 2013. Korpus tersebut memuat 74.329.815 kalimat, 7.964.109 tipe, dan 1.206.281.985 token. Salah satu kesulitan menggunakan Leipzig Corpora adalah tidak tersedianya menu KWIC yang dapat memudahkan pengguna melihat pola kata secara vertikal. Akan tetapi, Leipzig Corpora menyediakan graik yang memperlihatkan hubungan suatu kata dengan kata-kata terdekat yang berkolokasi di depan dan di belakang kata tersebut. Selain data korpus dari Leipzig Corpora, data juga diambil dari korpus IndonesianWaC dalam Sketch Engine. IndonesianWaC memiliki 109.281.359 token atau kata yang sudah dilabeli sehingga dapat memberi informasi lebih dibanding korpus yang lain. Sketch Engine juga memiliki keunggulan dibanding perangkat korpus lainnya, yaitu tersedianya menu word sketch dan sketch diff. Menu word sketch menampilkan ringkasan dari perilaku gramatikal dan kolokasional sebuah kata (Kilgarriff et al, 2004). Sementara itu, hasil dari sketch diff akan menampilkan perbedaan dari dua kata sehingga dapat terlihat bagaimana sepasang kata yang bersinonim berbeda satu sama lain. 34 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 34 8/2/16 11:19 AM Prosedur pengambilan data dari kedua korpus tersebut beserta analisisnya akan berbeda karena fasilitas yang disediakan oleh kedua laman korpus tadi juga berbeda. Data yang diperoleh dari Leipzig Corpora berupa data konkordansi, kolokasi, dan graik. Sementara itu, data yang diambil dari Sketch Engine berupa data word sketch dan sketch diff. Data yang diperoleh dari kedua korpus tersebut akan dianalisis melalui kolokasinya. Hal ini dilakukan karena beberapa kolokasi dapat memberi informasi yang tepat mengenai konsep suatu kata dalam konteksnya. Kolokasi dapat menyediakan “analisis semantik dari sebuah kata” (Sinclair, 1991) dan juga dapat “menyampaikan pesan secara implisit” (Hunston, 2002). III. ANALISIS PENELITIAN 3.1. Analisis data dari Leipzig Corpora Sebelum masuk ke analisis, terlebih dahulu akan dijelaskan mengenai proil kata mau, ingin, hendak, dan akan dalam Leipzig Corpora berdasarkan frekuensi kemunculannya yang dapat dilihat dalam Tabel 1. Dari keseluruhan 1.206.281.985 token dalam korpus bahasa Indonesia di Leipzig Corpora, kata hendak muncul sebanyak 100.270 kali, mau muncul sebanyak 699.957 kali, ingin sebanyak 840.371 kali, dan terbanyak akan sebanyak 6.676.654 kali. Kata mau ingin hendak akan Frekuensi kemunculan 699.957 840.371 100.270 6.676.654 Tabel 1. Frekuensi kemunculan kata mau, ingin, hendak, dan akan Kemunculan kata akan jauh lebih banyak dibandingkan tiga kata lainnya karena akan yang muncul dalam korpus bukan hanya akan yang memiliki makna mirip dengan mau, ingin, dan hendak saja. Sayangnya, dalam Leipzig Corpora pengguna tidak dapat menapis pencarian kata berdasarkan kelas katanya. Selanjutnya, seperti yang telah disinggung sebelumnya, agak sulit menganalisis keempat kata yang dikaji melalui baris konkordans karena data disajikan per kalimat. Kata yang akan dianalisis tidak diletakkan dalam satu kolom yang sejajar. Oleh karena itu, data dari korpus ini dianalisis berdasarkan graik kolokasi yang disajikan dalam gambar-gambar berikut. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 35 35 8/2/16 11:19 AM Gambar 1. Kolokasi dari kata mau dan ingin dalam Leipzig Corpora Gambar 2. Kolokasi dari kata akan dalam Leipzig Corpora Gambar 3. Kolokasi dari kata hendak dalam Leipzig Corpora 36 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 36 8/2/16 11:19 AM Gambar 1 menunjukkan bahwa kata mau banyak berkolokasi dengan kata cakapan seperti kalo, gak, aja, dan ane. Hal ini menunjukkan bahwa kata tersebut dalam korpus Leipzig berasal dari konteks nonformal. Sementara itu, kata ingin digambarkan hanya berkolokasi dengan tiga kata, yaitu jika, kami, dan tahu. Jika dalam KBBI adalah kata penghubung untuk menandai syarat. Walaupun agak sulit untuk menjabarkan Gambar 2 karena banyak kata yang kemungkinan berkolokasi dengan akan yang bukan bersinonim dengan mau, ingin, dan hendak, ada satu kata yang dicurigai berkolokasi dengan akan dimaksud yang tidak ditemukan pada graik kolokasi ketiga kata lainnya, yaitu kata tidak. Sementara itu, Gambar 3 memperlihatkan bahwa kata hendak berkolokasi dengan keterangan waktu (ketika, saat) dan kata kerja yang menunjukkan tujuan (pulang, pergi, menuju). 3.2. Analisis data dari IndonesianWaC Sketch Engine Dalam korpus IndonesianWaC dalam Sketch Engine, yang jumlah tokennya lebih sedikit dibanding dalam korpus Leipzig, frekuensi kemunculan kata mau, ingin, akan dan hendak dapat dilihat pada Tabel 2 berikut. Kata mau ingin hendak akan Frekuensi kemunculan 49.462 61.628 14.297 452.763 Tabel 2. Frekuensi kemunculan kata mau, ingin, hendak, dan akan Seperti halnya Tabel 1, data pada Tabel 2 juga menunjukkan bahwa frekuensi kemunculan kata hendak paling rendah sementara kata akan paling tinggi. Penjelasan untuk tingginya kemunculan kata akan sama seperti sebelumnya, yaitu karena kata akan memiliki homonim dan banyak polisem. Dari data juga dapat dilihat bahwa kata ingin lebih banyak muncul dibanding kata mau. Data yang didapat melalui fasilitas word sketch sedianya dapat memperlihatkan perilaku gramatikal dan kolokasional dari kata yang dianalisis. Sayangnya, mungkin karena program yang belum sempurna atau kesalahan teknis, data yang diperoleh tidak sesuai dengan yang diharapkan. Dalam word sketch, diperlihatkan kata apa saja yang berkolokasi dengan kata yang dianalisis berdasarkan kelas katanya. Namun ternyata, banyak kelas kata yang salah. Banyak verba yang masuk dalam kolom nomina, seperti yang dapat dilihat pada tabel di Gambar 4 berikut. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 37 37 8/2/16 11:19 AM Gambar 4. Tabel word sketch kata mau Sehubungan dengan itu, data word sketch yang akan dianalisis hanya data kolokasi nextright dan nextleft. Data kolokasi word sketch menunjukkan bahwa mau lebih banyak berkolokasi dengan kata cakapan. Kata cakapan yang berada di sebelah kiri yaitu nggak (419 kali), kalo (279 kali), gak (247 kali), ga (157 kali), gimana (86 kali), ngga (84 kali), enggak (65 kali), dan gue (69 kali), di sebelah kanan di antaranya bikin (132 kali), bilang (133 kali), dan nanya (111 kali). Sementara itu, pada word sketch kata ingin terlihat ada pronomina formal yang berkolokasi di sebelah kiri kata tersebut seperti anda (2.374 kali), engkau (163 kali), dan beliau (145 kali). Perbedaan formal-nonformal ini juga terlihat pada kemunculan kata tau dan tahu. Tau hanya ditemukan berkolokasi dengan mau sebanyak 136 kali, sedangkan kata tahu hanya ditemukan berkolokasi dengan ingin sebanyak 1.993 kali. Kolokasi kata akan memperlihatkan pola yang berbeda. Data menunjukkan bahwa pada kolokasi sebelah kiri kata tersebut terdapat kata tidak dengan jumlah kemunculan 34.036 kali dan tak sebanyak 4.204 kali. Hal ini mengonirmasi analisis sebelumnya dari korpus Leipzig. Selain kata-kata negasi, akan juga berkolokasi dengan kata-kata yang menunjukkan tingkatan kepastian atau kemungkinan seperti pasti (4.675 kali), tentu (2.121 kali), dan mungkin (3.172 kali) di sebelah kiri. Di sebelah kanan, kata-kata 38 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 38 8/2/16 11:19 AM yang menunjukkan kepastian itu di antaranya terus (5.067 kali), segera (2.970 kali), selalu (2.900 kali), dan tetap (2.978 kali). Data hendak justru memperlihatkan bahwa dalam korpus IndonesianWaC terdapat teks berbahasa Melayu. Dalam data kolokasi kata hendak terdapat kata kerana, bercadang, dan cuba yang bukan merupakan kosakata bahasa Indonesia. Selain dari itu, kolokasi kata hendak menunjukkan banyak pengandaian yang ditunjukkan oleh kata seakan (28 kali), seakan-akan (24 kali), seolah (19 kali), seolah-olah (50 kali), apabila (62 kali), dan bila (68 kali). Mengingat masih banyak kesalahan pelabelan kelas kata pada korpus IndonesianWaC, data sketch diff yang sedianya juga akan dianalisis dengan terpaksa diabaikan karena dengan data yang kurang valid dikhawatirkan hasil analisisnya menjadi salah. IV. SIMPULAN Dari analisis data yang berasal dari dua korpus di atas dapat diambil kesimpulan sebagai berikut. • mau lebih banyak digunakan dalam konteks nonformal, sementara ingin digunakan dalam konteks yang lebih formal. • akan banyak berkolokasi dengan penyangkalan, kemungkinan, dan kepastian. • hendak berkolokasi dengan keterangan waktu, pengandaian, dan banyak digunakan dalam bahasa Melayu. Kajian ini tidak bermaksud menawarkan deinisi baru dari keempat kata di atas. Namun, keterangan-keterangan yang dihasilkan dari analisis yang telah dilakukan diharapkan dapat membantu para penyusun kamus untuk memutakhirkan deinisinya. Untuk bisa mendapatkan hasil yang maksimal diperlukan korpus yang lebih komprehensif, memuat semua jenis, ranah dan genre teks, dan didukung oleh perangkat lunak yang mendukung. Sketch Engine sudah sangat mendukung penyusun kamus untuk dapat membedakan kata-kata yang bermiripan makna, hanya saja untuk korpus IndonesianWaC tagging-nya belum sempurna. Masalah penggunaan kata memang masuk dalam ranah pragmatik, tetapi tidak ada salahnya jika kamus juga memuat keterangan mengenai hal tersebut dalam deinisinya daripada hanya memberikan deinisi sinonim. Ini dapat membantu penutur terutama pemelajar bahasa. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 39 39 8/2/16 11:19 AM Daftar Pustaka Gries, Stefan Th. (2009). What is Corpus Linguistics? Language and Linguistics Compass Vol. 3 No. 5, pages 1225–1241, September 2009. The Author Journal Compilation @ 2009 Blackwell Publishing Ltd Hunston, S. (2002). Corpora in Applied Linguistics. Cambridge: Cambridge University Press Kilgarriff, A., Rychly, P., Smrz, P., and Tugwell, D. (2004). The Sketch Engine. Information Technology Research Institute Technical Report Series University of Brighton. McEnery, T., Hardie, A., (2012). Corpus Linguistics: Method, Theory, and Practice. Cambridge: CUP Sinclair, J.M. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press. Subroto, Edi. (2011). Pengantar Studi Semantik dan Pragmatik. Surakarta: Cakrawala Media Sugono, D. (Penyunting) (2007). Buku Praktis Bahasa Indonesia Jilid 2. Jakarta: Departemen Pendidikan Nasional Teubert, W. (2005). My version of corpus linguistics. International Journal of Corpus Linguistics, 10 (1), 1-13. Tognini-Bonelli, E. (2001). Corpus Linguistics at Work. Amsterdam: John Benjamins. Tim Redaksi KBBI. (2008). Kamus Besar Bahasa Indonesia Edisi Keempat. Jakarta: Gramedia Pustaka Utama. http://corpora.uni-leipzig.de/en?corpusId=ind_mixed_2013 diakses tanggal 9 Juli 2016 https://the.sketchengine.co.uk/auth/corpora/ diakses tanggal 9 Juli 2016 40 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 40 8/2/16 11:19 AM Menuju Pemanfaatan Leksikograis Korpus Bahasa Daerah: Keanekaragaman Tantangan dan Peluang Yanti, Ph.D. Nany Setyono Kurnia, Ph. D. Universitas Katolik Indonesia Atma Jaya [email protected]; [email protected] [email protected]; [email protected] Abstrak Sejarah panjang kegiatan penyusunan kamus sejumlah bahasa yang mendunia seperti bahasa Inggris menunjukkan bagaimana pemanfaatan data pemakaian bahasa di dunia nyata (bahasa alami) membuka celah peningkatan perbaikan mutu kamus. Penggunaan bahasa secara alami yang terhimpun dalam korpus bahasa, perkembangan pelbagai perangkat lunak yang mampu makin tajam menangguk data tertentu dari suatu korpus, dan peningkatan mutu korpus bahasa itu sendiri – dipadukan dengan intuisi penutur (jati) pekamus yang memanfaatkan semua ini – telah memperkaya kamus yang dihasilkan dalam rangka menjawab kebutuhan pengguna kamus yang disasar. Salah satu contoh, dalam hal kamus untuk pemelajar asing, adalah kemajuan dalam hal informasi frekuensi, fraseologi, dan penggunaan korpus pemelajar. Selain itu, tersedianya korpus bahasa berukuran besar dengan berbagai rancang bangun juga mendorong menjamurnya penelitian korpus yang hasilnya juga dapat mengilhami penyusunan kamus. Pola penyusunan dan pemanfaatan korpus bahasa seperti di atas tentu dapat pula diterapkan pada Bahasa Indonesia dan bahasa daerah yang penutur (jati) dan bahan-bahan ragam tulisnya relatif tidak sukar ditemukan. Akan tetapi, sebagaimana kita ketahui, bahasa-bahasa daerah di Indonesia mempunyai rentang keanekaragaman yang sangat lebar, mulai dari yang masih hidup dengan subur sampai yang terancam punah. Makalah ini, menapak dari pengamatan dan pengalaman menyangkut upaya dokumentasi sejumlah bahasa daerah di Indonesia, selanjutnya membahas berbagai tantangan yang dihadapi dan peluang yang dimungkinkan oleh kemajuan teknologi untuk membuka jalan yang lebih lapang ke arah tersusunnya korpus bahasa-bahasa Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 41 41 8/2/16 11:19 AM daerah. Penyusunan korpus bahasa daerah tanpa tradisi tulis dan yang belum dikenal hal ihwal tata bahasanya, misalnya, berbeda tantangannya dengan penyusunan korpus bahasa daerah yang banyak karya tulisnya dan yang sistem ejaan serta tata bahasanya sudah banyak dipelajari dan dikenal. Tantangantantangan ini mengisyaratkan perlunya pengerahan daya dan kerja keras untuk penyusunan korpus bahasa yang tertata baik. Makalah ini mengusulkan agar upaya mewujudkan tersedianya korpus bahasa daerah – yang nantinya dapat digunakan bersama – dilakukan dengan pendekatan kegotongroyongan, yaitu dengan melibatkan pihak-pihak yang sudah melakukan dokumentasi bahasa daerah di Indonesia dan masyarakat luas. Kemajuan teknologi sangat memungkinkan penggalangan data bahasa yang memenuhi ciri-ciri atau persyaratan yang ditetapkan dari khalayak ramai yang awam sekalipun. Hasilnya ditampung untuk diolah lebih lanjut dan berangsur-angsur mewujud menjadi korpus bahasa daerah yang dapat terus ditingkatkan mutuya. I. PENDAHULUAN Penutur suatu bahasa seringkali mempunyai keterikatan yang kuat dengan bahasanya, seperti terlihat dalam kegaduhan di Perancis gara-gara perubahan ejaan yang mulai diimplementasikan tahun 2016 ini, sekalipun telah 26 tahun berselang sejak pencanangan reformasi ejaan itu. Sikap berapi-api menentang perubahan itu antara lain dicetuskan dalam bentuk kampanye #Je suis circonlexe meniru unjuk solidaritas Je suis Charlie setelah penyerangan kantor majalah “Charlie Hebdo” di Paris awal 2015 silam untuk bersama-sama menolak penghapusan tanda aksen sirkonleks yang menyerupai topi di atas huruf hidup itu (Johnson 2016; Lichield 2016). Kenyataan bahwa seseorang dapat sangat mengebu-gebu dalam hal-hal yang berkaitan dengan bahasa dan bahwa pekerjaan besar dapat diselesaikan secara gotong royong melalui penggalangan partisipasi khalayak ramai/sukarelawan (urun daya/crowdsourcing) seperti misalnya gerakan yang dikenal dengan nama Kawal Pemilu pada pemilihan Presiden (Pilpres) Republik Indonesia 2014 yang lalu (https://id.wikipedia.org/wiki/KawalPemilu.org) mengilhami gagasan utama yang diajukan dalam makalah ini. Sungguh tepat Seminar Leksikograis Indonesia yang diselenggarakan Badan Bahasa kali ini mengambil tema “Tantangan Leksikograis Bahasa-Bahasa daerah di Indonesia”, karena menurut catatan www.ethnologue.com terdapat 713 bahasa daerah di Indonesia, 701 di antaranya masih hidup dengan berbagai tingkat kebelumpunahan. Suatu tantangan besar bila untuk setiap bahasa daerah diharapkan akan tersusun sebuah kamus yang baik dan kamus yang sudah ada ditingkatkan mutunya. 42 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 42 8/2/16 11:19 AM Bagian kedua makalah ini akan membahas kontribusi korpus bahasa dalam penyusunan kamus. Dengan mengambil contoh dari Bahasa Inggris (selanjutnya disebut BING) dan bahasa Indonesia (selanjutnya disebut BI) sejumlah manfaat yang dapat diperoleh penggunaan korpus bahasa dalam penyusunan kamus diketengahkan. Penyusunan suatu korpus bahasa untuk keperluan penyusunan kamus melibatkan penentuan rancang bangun korpus yang berimbang dan pengumpulan data berupa sampel pemakaian bahasa sesuai dengan rancang bangun yang sudah ditentukan. Bertolak dari pengalaman lapangan dalam pengumpulan data untuk menyusun basis data bahasa daerah di Indonesia termasuk dinamika pelatihan pengumpul data, bagian ketiga makalah ini membahas keanekaragaman tantangan yang dihadapi. Makalah diakhiri dengan bagian keempat yang membahas peluang-peluang yang ada serta kemungkinan-kemungkinan pemanfaatannya. II. KAMUS DAN KORPUS BAHASA Penggunaan data dari korpus bahasa untuk penyusunan kamus kini sudah menjadi kelaziman, sebagaimana dikatakan oleh Sue Atkins dan Michael Rundell (2008: 3): “In the twenty-irst century, all good dictionaries take corpus data as their starting point,…”. Tulisan Adi Budiwiyanto di laman Badan Bahasa (http://badanbahasa.kemdikbud.go.id/ lamanbahasa/artikel/1580) mengulas peran korpus dalam penyusunan kamus secara ringkas bernas. Intinya, dalam penyusunan kamus pekamus tidak hanya menggunakan introspeksi yang bertumpu pada intuisinya selaku penutur bahasa yang bersangkutan tetapi juga melakukan observasi bagaimana bahasa tersebut digunakan oleh penuturnya di dunia nyata. Penggunaan bahasa secara alami ini dikumpulkan sampelnya secara sistematis menjadi suatu korpus bahasa untuk ditelaah oleh pekamus agar dapat menggambarkan kosakata bahasa yang bersangkutan dengan tepat. Sejumlah hal yang tercakup dalam tulisan tersebut akan diulas di sini untuk menekankan pentingnya penggunaan korpus bahasa dalam penyusunan kamus: frekuensi dan senarai/daftar kata, ungkapan multikata, serta korpus pemelajar. Contoh-contoh yang digunakan dalam pembahasan hal di atas diambil dari kamus BING dan BI serta sebuah korpus BI. Kamus BING yang dikutip adalah kamus ekabahasa untuk pemelajar tingkat lanjut dari Macmillan (Rundell 2007), sementara kamus BI yang dikutip adalah Kamus Besar Bahasa Indonesia Pusat Bahasa edisi ke 4 (Pusat Bahasa 2008), yang selanjutnya akan disebut KBBI. Data korpus yang digunakan berasal dari korpus BI susunan Hananto, Markus, dan Kurnia (2011) sebesar sekitar 10 juta kata meliputi teks-teks di bawah ini: • buku sekolah (pendidikan dasar dan menengah) daring yang disediakan oleh Kementerian Pendidikan Nasional • cerita untuk anak-anak • cerita untuk orang dewasa Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 43 43 8/2/16 11:19 AM • bacaan non-iksi untuk orang dewasa dari empat surat kabar daring, berita dan bukan-berita. Karena cerita untuk anak-anak ukurannya kecil sekali (total hanya sekitar 120 ribuan kata), korpus sekitar 10 juta ini dipilah menjadi tiga subkorpus: 1. Buku sekolah dan cerita untuk anak-anak (sekitar 4,75 juta kata) 2. Bacaan dewasa iksi (sekitar 3 juta kata) 3. Bacaan dewasa bukan-iksi (sekitar 2,25 juta kata). 2.1 Frekuensi dan Senarai / Daftar Kata Frekuensi atau kekerapan digunakannya suatu kata atau ungkapan hanya dapat diperoleh dari suatu korpus, sebagaimana dikatakan oleh Geoffrey Leech (2011: 7): If asked what is the one beneit that corpora can provide and that cannot be provided by other means, I would reply ‘information about frequency’. Informasi tunggal tentang frekuensi penggunaan suatu kata atau ungkapan dalam suatu korpus, misalnya kata X muncul Y kali dalam korpus Z, tidaklah banyak gunanya, tetapi dapat menjadi sangat berguna jika digandengkan dengan informasi frekuensi kata atau ungkapan lain dalam korpus yang sama atau informasi frekuensi kata yang sama di korpus lain. Berdasarkan data frekuensi ini telah disusun berbagai senarai atau daftar kata (Coxhead 2000; Gardner dan Davies 2014; Leech, Rayson, dan Wilson 2001; Paquot 2010; West 1953; Xue dan Nation 1984). Kata yang kerap dipakai dalam suatu bahasa penting dikuasai oleh pemelajar bahasa tersebut karena akan kerap ditemuinya. Kamus BING ekabahasa untuk pemelajar tingkat lanjut telah lama menggunakan apa yang disebut ‘controlled deining vocabulary’ (Cowie 1999: 110), artinya semua deinisi atau batasan makna yang ada dalam kamus itu sedapat mungkin menggunakan sejumlah (misalnya dua ribu) kata berfrekuensi tertinggi dalam BING berdasarkan korpus yang disusun oleh penerbit kamus. Dengan cara ini diharapkan pengguna kamus yang mencari makna suatu kata tidak menemui batasan makna yang mengandung kata-kata berfrekuensi rendah (kata-kata yang jarang dipakai) yang tidak dikenalinya sehingga ia harus mencari pula makna kata-kata tersebut. Berdasarkan senarai kata yang dikembangkan oleh penerbit yang bersangkutan, kamus BING ekabahasa untuk pemelajar tingkat lanjut (terbitan Longman, Oxford, Macmillan, dan lain-lain) biasanya juga memberi tanda tertentu pada lema yang merupakan kata yang kerap kali dipakai (baik pada umumnya atau dalam ragam tertentu, seperti misalnya bahasa akademik) agar pemakai kamus memberikan perhatian khusus pada lema tersebut. 2.2 Ungkapan Multikata Kekayaan kosakata suatu bahasa tidak hanya berbentuk kata-kata tunggal tetapi juga ungkapan-ungkapan multikata dalam berbagai bentuk, seperti idiom, kolokasi, ungkapan-ungkapan rutin untuk hal-hal tertentu dan lain-lain (Granger dan Meunier 44 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 44 8/2/16 11:19 AM 2008; Moon 1998; Nattinger dan DeCarrico 1992; Pawley dan Syder 1983). Penguasaan ungkapan multikata sangat membantu seorang pemelajar untuk berbahasa secara natural dan meningkatkan kefasihan bertuturnya. Berdasarkan suatu korpus atau sejumlah korpus tertentu yang digabung atau dikontraskan telah disusun berbagai senarai ungkapan multikata (Biber dan Barbieri 2007; Biber, Conrad, dan Cortes 2004; Hyland 2008; Martinez dan Schmitt 2012; Shin dan Nation 2008; Simpson-Vlach dan Ellis 2010). Data korpus dapat membantu pekamus melihat pemakaian ungkapan multikata dalam berbagai ragam bahasa, misalnya penggunaan gugus kata atau gabungan kata BARANG TENTU yang dapat kita temukan di bawah lema BARANG yang kedua di KBBI (yakni adverba BARANG) seperti tersalin pada Gambar 1 di bawah ini. Sesuai patokan yang digunakan KBBI (hal. XXXV) gabungan kata ini diletakkan di bawah lema atau sublema yang menjadi unsur pertama yaitu BARANG, dan diberi batasan makna ‘tentu saja’: Gambar 1. Gugus kataBARANG TENTU di bawah lema BARANG (adverba) di KBBI (Pusat Bahasa 2008: 140) Dengan bantuan perangkat lunak ANTCONC (Anthony 2014) kita akan mendapati 17 gugus kata BARANG TENTU dalam korpus BI sebesar sekitar sepuluh juta kata susunan Hananto, Markus, dan Kurnia (2011) yang telah diuraikan di atas. Gambar 2 di bawah ini menunjukkan ketujuhbelas larik konkordans BARANG TENTU dalam korpus tersebut, masing-masing dengan subkorpus asalnya. Dengan bantuan itur pengurutan pada ANTCONC (Anthony 2014) ketujuhbelas larik pemakaian BARANG TENTU ini dapat disusun berdasarkan kata pertama di sebelah kiri gugus kata BARANG TENTU tersebut yang diurut secara alfabetis (Gambar 3). Dengan pengurutan seperti pada Gambar 3 di bawah ini jelas terlihat bahwa 15 dari 17 kali pemunculan BARANG TENTU dalam korpus tersebut didahului dengan kata SUDAH, sementara pada dua pemakaian BARANG TENTU lainnya BARANG tidak berkaitan (tidak dalam satu frasa) dengan TENTU sebagaimana terlihat dari adanya koma setelah kata BARANG pada larik yang kedua, sementara tanpa koma pun, larik pertama Setiap manusia menggunakan barang tentu ada tujuannya jelas menunjukkan bahwa BARANG tidak terkait dengan TENTU. Perlu ditegaskan di sini bahwa sekalipun cukup memadai untuk tujuan utama pembuatannya, korpus sekitar 10 juta kata yang dipakai Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 45 45 8/2/16 11:19 AM sebagai sumber data di sini tergolong kecil ukurannya dan jauh dari sempurna rancang bangunnya untuk merepresentasikan BI. Namun demikian, hasil 17 larik konkordans ini, dikombinasikan dengan intuisi penutur jati BI, cukup kuat mengindikasikan perlunya kita melakukan observasi dengan data bahasa alami yang cakupannya lebih luas dan berimbang untuk menentukan apakah gugus kata yang baku adalah BARANG TENTU atau SUDAH BARANG TENTU. Gambar 2. Larik konkordans BARANG TENTU Gambar 3. Larik konkordans gugus kata BARANG TENTU (disusun berdasarkan urutan alfabetis kata pertama di sebelah kirinya) 46 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 46 8/2/16 11:19 AM Contoh lain adalah larik konkordans untuk gugus kata ASAL TAHU SAJA (Gambar 4): Gambar 4. Sembilan larik konkordans ASAL TAHU SAJA dan subkorpus asalnya Berbeda dengan larik konkordans SUDAH BARANG TENTU yang terutama muncul di sub-korpus Buku Sekolah dan Fiksi Anak, larik konkordans ASAL TAHU SAJA tampak muncul merata di ketiga sub-korpus. Selain itu, sekalipun masih diperlukan telaah lebih lanjut, larik ASAL TAHU SAJA yang terlihat di sini mengesankan berasal dari ragam lisan, indikasi yang tidak muncul pada larik konkordans SUDAH BARANG TENTU. Di lain pihak, sebagaimana terlihat pada lema ASAL di KBBI (Gambar 5), gugus kata ASAL TAHU SAJA tidak tercantum di bawah lema ini, sama halnya dengan SUDAH BARANG TENTU yang tidak tertera di bawah lema BARANG. Gambar 5. Lema ASAL di KBBI (Pusat Bahasa 2008: 90) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 47 47 8/2/16 11:19 AM Tentu saja suatu kamus, terlebih-lebih kamus cetak, punya keterbatasan ruang yang dapat sangat mengungkung, sehingga pekamus harus benar-benar ketat menyeleksi ungkapan mana yang akan dimasukkan di bawah suatu lema atau sub-lema. Artinya, walau pun seandainya kedua gugus kata yang baru dibahas itu dianggap sebagai ungkapan multikata BI yang sah, belum tentu pekamus dapat memasukkannya ke dalam KBBI, misalnya karena ungkapan itu kalah bersaing dengan ungkapan lain yang frekuensi pemakaiannya lebih tinggi. Akan tetapi, bila KBBI dimaksudkan untuk mencakup semua kosakata BI, serupa dengan bagaimana, seperti digambarkan oleh Simon Winchester (2003: 41), awal mulanya di abad ke-19 The Oxford English Dictionary itu diidamidamkan: A dictionary of the English language in its totality…that would give, in essence and in fact, the meaning of everything. maka penyusun KBBI perlu mempertimbangkan seluruh ungkapan BI yang ada, termasuk kedua gugus kata tadi. 2.3 Korpus Pemelajar Tulisan Adi Budiwiyanto dalam laman Badan Bahasa mengenai peran korpus dalam penyusunan kamus yang telah disebut di atas juga membahas tipologi korpus. Di antaranya adalah korpus pemelajar (bahasa asing) yang dibedakan atau dikontraskan dengan korpus penutur jati. Tipologi berdasarkan status penutur bahasa ini juga mengenal korpus perkembangan dan korpus lingua franca (Cheng 2012). Korpus perkembangan adalah korpus penutur jati yang masih dalam tahap pemerolehan bahasa ibu mereka, seperti misalnya anak-anak, atau mahasiswa yang sedang dalam proses pemerolehan bahasa akademik yang matang. Adapun korpus lingua franca biasanya adalah korpus BING yang penuturnya sehari-hari dengan cukup fasih menggunakan BING sebagai lingua franca dalam komunikasi tetapi bahasa-ibu mereka bukan BING. Salah satu contoh korpus pemelajar BING adalah ICLE (The International Corpus of Learner English) yang dikembangkan oleh Centre for English Corpus Linguistics, Universitas Katolik Louvain di Belgia (http://www.uclouvain.be/en-cecl-icle.html). Korpus ini berisikan esai argumentatif karya pemelajar BING dengan tingkat kemahiran menengah atas dan lanjut dari enambelas latarbelakang bahasa-ibu yang berbeda. Pusat Korpus Linguistik BING tersebut telah mengundang pihak luar untuk ikut serta mengisi korpus pemelajar BING ini dan esai yang berhasil dikumpulkan dalam korpus hasil kerjasama internasional dengan berbagai universitas rekanan ini memenuhi ketentuan ciri-ciri yang sama karena diterapkannya petunjuk pengumpulan korpus yang sama. Data korpus pemelajar seperti ini dapat menunjukkan kesulitan-kesulitan pemelajar yang terjadi berulangkali dan dialami oleh pemelajar dengan berbagai latarbelakang bahasa-ibu (Rundell dan Granger 2007). Kerjasama penerbit kamus Macmillan dengan Pusat Linguistik Korpus BING di Louvain telah memanfaatkan data dari korpus pemelajar yang disusun pusat tersebut dalam upaya peningkatan isi kamus ekabahasa Macmillan 48 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 48 8/2/16 11:19 AM untuk pemelajar BING (Rundell 2007; Rundell dan Granger 2007). Contoh di bawah ini menggambarkan bagaimana hasil penelitian yang menunjukkan kurangnya kesadaran pemelajar bahasa akan perbedaan ragam lisan dengan ragam akademik tulis yang formal sifatnya dapat dimanfaatkan untuk memperkaya kamus dengan menambahkan catatan khusus mengenai hal ini. Gaëtanelle Gilquin dan Magali Paquot (2007) menunjukkan perbedaan dan kemiripan yang signiikan frekuensi pemakaian kata MAYBE (Gambar 6) dalam empat korpus BING: • 10 juta kata ragam lisan penutur jati dari BNC (The British National Corpus) • 15 juta kata teks akademik penutur jati yang diambil dari BNC • Hampir 1,5 juta kata dari korpus pemelajar ICLE dengan 16 bahasa-ibu • Sekitar 300,000 kata LOCNESS (Corpus of Native English Essays), teks akademik karya mahasiswa Inggris dan Amerika penutur jati BING, sebuah korpus yang bisa digolongkan ke dalam korpus perkembangan. Dari perbedaan frekuensi yang tampak pada Gambar 6 di bawah dapat disimpulkan bahwa karya tulis formal pemelajar asing BING maupun penutur jati BING yang masih dalam fase perkembangan lebih mendekati ciri ragam lisan dalam hal kekerapan penggunaan kata MAYBE. Hasil ini, diperluas dengan perbandingan frekuensi pemakaian PERHAPS yang merupakan padanan MAYBE tetapi lebih formal, dimanfaatkan oleh kamus Macmillan ekabahasa bagi pemelajar tingkat lanjut BING untuk memberikan catatan khusus pada lema MAYBE (Gambar 7) maupun dalam sisipan Improve your Writing Skills kamus tersebut (Rundell 2007: IW17). Gambar 6. Perbandingan frekuensi (per 1 juta kata) pemakaian kata MAYBE dalam 4 korpus (Gilquin dan Paquot 2007: 8) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 49 49 8/2/16 11:19 AM Gambar 7. Catatan khusus di bawah lema MAYBE kamus Macmillan untuk pemelajar asing tingkat lanjut (Rundell 2007: 931) III. TANTANGAN-TANTANGAN PENGEMBANGAN BASIS DATA KORPUS BAHASA DAERAH Tantangan yang dihadapi untuk membuat korpus bahasa-bahasa daerah di Indonesia (selanjutnya, BD) sebagai basis data untuk pengolahan lebih lanjut tidaklah ringan dan sangat beraneka ragam. Selain jumlahnya yang besar, kondisi kehidupannya sebagai alat komunikasi juga berbeda-beda. Sebagian sudah ada data dan kajiannya, sedang yang lain belum tersentuh sama sekali. 3.1. Keanekaragaman Kondisi Kekinian Bahasa Daerah di Indonesia Seperti yang telah disampaikan di bagian pendahuluan, Ethnologue mencatat sebanyak 719 bahasa di Indonesia dan hanya 707 yang masih digunakan. 701 dari bahasa yang masih digunakan ini, dikategorikan sebagai bahasa asli, yaitu bahasa daerah. Rentang keanekaragaman bahasa-bahasa daerah di Indonesia (selanjutnya, BD) sangat lebar. Seperti yang juga dilaporkan oleh Ethnologue, 76 dari bahasa tersebut berstatus mendekati kepunahan, sementara 266 bahasa lainnya dinyatakan dalam status rawan punah dan 261 masih cukup kuat, dalam arti masih berperan sebagai bahasa sehari-hari semua generasi penutur jati (https://www.ethnologue.com/country/ID). Selain memiliki tingkat kebelumpunahan yang beraneka ragam, tradisi dari BD juga berbeda-beda. Ada bahasa yang sudah memiliki tradisi tulis dan sistem ejaannya 50 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 50 8/2/16 11:19 AM jelas, seperti bahasa Jawa dan bahasa Sunda, ada pula bahasa yang tidak ada tradisi tulisnya, apalagi sistem ejaannya. Bahasa-bahasa yang masuk dalam kategori kedua, hanya memiliki tradisi lisan dan BD yang masuk dalam kategori ini mungkin jumlahnya lebih besar. Dari segi tersedia tidaknya literatur BD juga berbeda antara yang satu dengan yang lain. Ada bahasa yang hal ikhwal tata bahasanya sudah banyak dipelajari dan literaturnya pun sudah cukup banyak, seperti bahasa Jawa dan bahasa Sunda. Sementara itu ada bahasa yang jumlah literatur dan deskripsi bahasanya masih terbatas, seperti bahasa-bahasa dalam kelompok bahasa Kerinci di Provinsi Jambi. Akhirnya, pasti ada pula bahasa yang sama sekali belum dipelajari dan tidak ada literaturnya. 3.2 Produk-produk tentang Bahasa Daerah di Indonesia 3.2.1 Produk cetak Produk-produk tentang BD, terutama dalam bentuk deskripsi tata bahasa, kamus, dan karya ilmiah, sudah cukup banyak diterbitkan, khususnya dalam versi cetak. Pada tahun 1970-1980an, Pusat Pembinaan dan Pengembangan Bahasa (sekarang Badan Bahasa) di bawah Departemen Pendidikan dan Kebudayaan, misalnya, menerbitkan sejumlah buku tentang tata bahasa dan kamus bahasa daerah di Indonesia, antara lain: • • • • • • • • Morfologi dan Sintaksis Bahasa Kaili (Sofyan dkk. 1979) Morfologi dan Sintaksis Bahasa Rejang (Napsin dkk. 1981) Kamus Melayu Langkat-Indonesia (Masindan dkk. 1985) Kosa Kata Bahasa Melayu Riau (Sulaiman dkk. 1986) Struktur Bahasa Pekal (Nikelas dkk. 1986) Struktur Bahasa Muko-Muko (Manan dkk. 1986) Morfologi dan Sintaksis Bahasa Komodo (Troeboes dkk. 1987) Struktur Bahasa Baru (Elbar dkk. 1987) Arka (2013: 89) mencatat 1556 judul publikasi yang diterbitkan Badan Bahasa dalam kurun waktu 1975-2007 dan sepertiga di antaranya membahas BD dan bahasa yang paling banyak ditulis adalah bahasa Jawa, bahasa daerah yang jumlah penutur jatinya paling banyak1. Selain itu, dari tahun 1975 hingga sekitar 2004, Pusat Kajian Bahasa dan Budaya (PKBB – dahulu Lembaga Bahasa) Unika Atma Jaya melalui serial NUSA telah menerbitkan tulisan yang berisi deskripsi bahasa dan artikel ilmiah dari sejumlah BD, antara lain Miscellaneous Studies in Indonesian and Languages in Indonesia, bagian I hingga bagian X (Verhaar 1975, Halim 1977, Poedjosoedarmo 1977, Suharno 1 Perlu dicatat bahwa publikasi-publikasi ini, khususnya yang diterbitkan sebelum tahun 2000 tidak mudah diakses tidak semua perpustakaan memiliki koleksinya dan juga karena tidak ada versi elektroniknya. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 51 51 8/2/16 11:19 AM 1977, Verhaar 1978, Halim 1979, Dardjowidjojo dan Verhaar 1983, Verhaar 1984, Dardjowidjojo 1986, 1987, Purwo 1990) serta sebuah kamus berjudul Asilulu-Englsih Dictionary (Collins 2003)2. Produk tentang BD, baik berupa buku tata bahasa maupun kamus, juga diterbitkan oleh pihak-pihak lain, misalnya: • • • • • • • Wolio Dictionary: Wolio, English, Indonesian (Anceaux 1987) Muna-English dictionary (Berg dan Sidu 1996) Kamus Muna-Indonesia (Berg dan Sidu 2000) A grammar of the Pendau language of central Sulawesi, Indonesia (Phil 2007) A Grammar of Tukang Besi (Donohue 2009) A Grammar of Madurese (Davies 2010) Kamus Bahasa Rongga (Arka 2012) 3.2.2 Produk-produk daring Selain produk-produk cetak, publikasi-publikasi yang relatif lebih baru sudah banyak yang tersedia secara daring. SIL Internasional, misalnya telah memublikasikan sedikitnya 444 artikel dan buku linguistik yang terkait dengan BD (http://www.sil.org/ resources/publications/search/country/Indonesia/domain/linguistics)3. SEALANG library (http://sealang.net/library/) memiliki koleksi kamus bahasa Indonesia dan beberapa BD, yaitu kamus bahasa Bali, kamus bahasa Bugis, kamus bahasa Jawa, dan kamus bahasa Melayu. Dalam perkembangannya, NUSA telah menjadi jurnal berkala sejak 2013 dan masih menerbitkan karya-karya ilmiah mengenai bahasa-bahasa di Indonesia dan sekitarnya yang versi elektroniknya dapat diakses secara gratis melalui http://www. aa.tufs.ac.jp/en/publications/nusa4. Austronesian basic vocabulary database yang dapat diakses di http://language.psy.auckland.ac.nz/austronesian/ merupakan pangkalan data yang memuat kosa kata dari sekitar 1.369 bahasa yang digunakan wilayah Pasiik, termasuk cukup banyak BD. 3.3. Basis Data Korpus Bahasa Daerah Walaupun sejumlah produk telah dipublikasikan baik cetak maupun elektronik, data dalam publikasi-publikasi itu merupakan data yang sudah diseleksi dari korpus yang dimiliki oleh peneliti. Penyeleksian data ini biasanya erat kaitannya dengan Versi elektronik terbitan NUSA periode 1975-2004 ini kini disimpan dan dapat diakses di http://sealang. net/nusa/. 2 SIL International jugalah yang mengembangkan www.ethnologue.com, sebuah situs yang menyediakan semacam katalog yang menyeluruh mengenai bahasa-bahasa yang masih digunakan di dunia, termasuk di Indonesia. 3 Jurnal NUSA merupakan salah satu wujud sama PKBB Unika Atma Jaya dan Institute for Languages and Cultures of Asia and Afrika (ILCAA), Tokyo University of Foreign Studies. Versi cetak dapat diperoleh di PKBB Unika Atma Jaya. 4 52 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 52 8/2/16 11:19 AM tujuan penulisan dan terbatasnya ruang yang tidak memungkinkan para penulis untuk memasukkan semua data yang ada. Selain itu, data yang dipublikasikan pun acapkali sudah mengalami penyuntingan, seperti yang disampaikan oleh Budiwiyanto (Badan Bahasa). Sementara itu, banyak bahan mentah berupa korpus dari publikasi-publikasi tersebut tidak didapat diakses untuk dilakukan penelitian lanjutan. Ada sebagian kecil BD yang data mentahnya dipublikasikan secara daring. SEALANG library (http://sealang.net/library/), misalnya, selain memiliki koleksi kamus juga memiliki korpus dari bahasa Indonesia, bahasa Melayu, bahasa Bali, bahasa Bugis, dan bahasa Jawa5. Ada juga The DOBES Archive (http://dobes.mpi.nl/#), sebuah portal yang menampung basis data dari berbagai bahasa di dunia, termasuk beberapa BD, seperti bahasa Totoli di Sulawesi dan empat bahasa di Kepulauan Aru. Korpus dari The DOBES Archive ini sudah diintegrasikan di dalam The Language Archive (TLA) (https://corpus1.mpi.nl/ds/asv/?19), tempat penyimpanan basis data bahasa-bahasa di dunia yang diprakarsai oleh the Max Planck Institute for Psycholinguistics di Nijmegen. Basis data korpus yang dipublikasikan di TLA ada yang aksesnya terbuka untuk umum, ada juga yang aksesnya harus dimintakan kepada penyumbang data, serta ada yang aksesnya tertutup. Basis data korpus dari BD yang sudah ada tentu masih dapat ditingkatkan dalam hal ukuran dan cakupan datanya. Semakin besar ukuran dan cakupan data sebuah basis data korpus, maka pemahaman akan bahasa tersebut menjadi lebih baik dan produk yang dapat dihasilkan berdasarkan korpus tersebut juga diharapkan baik. Sementara itu, untuk BD yang belum ada basis data korpusnya, produk-produk yang sudah dipublikasikan dapat memberikan gambaran untuk rancang bangun sebuah basis data korpus bahasa yang terkait. Akhirnya, untuk BD yang belum pernah dipelajari tentu saja upaya pengembangan basis data korpusnya menjadi jauh lebih sulit, meskipun bukan berarti tidak dimungkinkan. 3.4 Kesulitan-kesulitan Pengumpulan Sampel Bahasa Daerah di Indonesia Dalam prakteknya, pengumpulan sampel BD dalam rangka penyusunan basis data korpus memang bukan perkara yang mudah. Pertama, seperti yang disampaikan oleh Budiwiyanto (Badan Bahasa), daerah-daerah di mana bahasa-bahasa yang terancam punah itu sulit diakses karena letaknya jauh di pedalaman, di pegunungan, atau di pulau terpencil sehingga diperlukan waktu dan upaya yang tidak sedikit untuk ke sana dan juga bagaimana masyarakat setempat dapat menerima kedatangan peneliti. 5 Keempat bahasa daerah yang ada korpusnya ini merupakan bahasa yang sudah cukup banyak ditulis di dalam literatur dan yang jumlah penuturnya besar. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 53 53 8/2/16 11:19 AM Selain masalah geograis di atas, ada sejumlah kesulitan yang dihadapi dalam upaya pengumpulan sampel BD untuk penyusunan korpusnya, mulai dari pengumpulan data, penganotasian data, hingga penyuntingan data. Untuk bahasa-bahasa yang belum pernah diteliti, bagaimana seorang peneliti akan memulainya? Apakah menggunakan daftar kata dan bagaimana berkomunikasi dengan penuturnya ? Selain itu, seringkali bahasa alami tidak serta merta keluar dari penutur jati dengan hadirnya peneliti yang notabene “orang asing” dan mungkin tidak fasih atau bahkan tidak dapat berkomunikasi dalam bahasa setempat pada suatu kegiatan berbahasa. Penutur jati mungkin menjadi lebih formal dalam berbahasa atau mungkin banyak menggunakan istilah-istilah bahasa yang dianggap lebih bisa dipahami peneliti, misalnya bahasa Indonesia atau bahasa yang lebih besar di sekitar wilayah tersebut. Masih dalam konteks pengumpulan sampel bahasa, data dikumpulkan idealnya berasal dari berbagai praktek kebahasaan komunitas penutur bahasa yang diteliti. Namun ada praktek-praktek kebahasaan yang tidak selalu atau sering dilakukan. Hal ini mengakibatkan sulitnya mendapatkan sampel bahasa demikian. Setelah data rekaman terkumpul, tentu ada isu-isu yang muncul ketika data tersebut akan dianotasi. Sistem ejaan yang digunakan tentu penting sekali dalam upaya mendapatkan teks data yang konsisten. Penentuan apakah dua buah bunyi merupakan dua fonem yang berbeda atau hanya variasi bunyi misalnya sangatlah penting. Penentuan batas morfem dari suatu kata dan bagaimana morfem-morfem diartikan juga tidak mudah dilakukan. Untuk bahasa yang sudah ada sistem ejaan dan sistem bahasanya sudah dilaporkan sebelumnya, masalah ini bukan lagi menjadi masalah. IV. PELUANG PEMANFAATAN SUMBER DAYA DAN TEKNOLOGI Pekerjaan besar untuk menyusun basis data korpus bahasa daerah tidak harus ditangani sendiri; sub-bab 2.3 telah menggambarkan suksesnya Centre for English Corpus Linguistics, di Belgia mengembangkan korpus pemelajar ICLE (The International Corpus of Learner English) dengan mengundang partisipasi sukarela sejumlah pihak tanpa mengorbankan keseragaman data yang terkumpul karena pihak-pihak yang berkontribusi menjalankan petunjuk-petunjuk pengumpulan data yang telah ditentukan. Cara crowdsourcing atau urun daya yang penuh gotong royong seperti ini sangat mungkin untuk dilakukan dalam hal pengembangan basis data korpus bahasa daerah mengingat semangat berkobar-kobar yang sering ditunjukkan terhadap persoalan kebahasaan. Selain itu, kemajuan teknologi memungkinkan peran serta khalayak ramai memberikan kontribusi kepada pengembangan korpus bahasa daerah tanpa batas waktu dan tempat. Yang berminat untuk ikut serta memberikan kontribusi bahan korpus bisa mendapatkan petunjuk-petunjuk pengumpulan data elektronik yang harus diikuti, atau bahkan mendapat pelatihan, mendapat pinjaman alat yang diperlukan (alat perekam, misalnya) dan nantinya mengunggah hasil pengumpulan bahannya ke dalam wadah penampungan data yang telah disiapkan. 54 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 54 8/2/16 11:19 AM Bahan-bahan korpus yang sudah terkumpul dari urun data tersebut kemudian disunting dan ditampilkan dalam bentuk basis data korpus BD yang terbuka untuk diakses khalayak ramai. Sudah terbukti bahwa banyak penelitian kebahasaan telah dihasilkan dari terbukanya akses terhadap berbagai korpus bahasa daring, seperti misalnya dapat dilihat dari daftar panjang penelitian (http://corpus.byu.edu/researchers. asp) yang berkaitan dengan korpus-korpus di laman http://corpus.byu.edu/. Bila basis data korpus BD yang sudah ada dibuka aksesnya untuk umum, dapat dharapkan akan muncul penelitian-penelitian tentang BD yang dapat meningkatkan pemahaman kita akan BD terkait. Daftar Pustaka Anceaux, J.C. 1987. Wolio dictionary: Wolio, English, Indonesian. Dordrecht: Foris Publications Holland. Anthony, Laurence. 2014. AntConc (Versi 3.4.4). Tokyo: Waseda University. Diunduh dari http://www.antlab.sci.waseda.ac.jp/software.html#antconc Arka, I. Wayan. 2012, Kamus bahasa Rongga-Indonesia: dengan pelacak kata Bahasa Indonesia-Rongga, Penerbit Universitas Atma Jaya, Jakarta Indonesia. Arka, I. Wayan. 2013. Language management and minority language maintenance in (eastern) Indonesia: strategic issues Language Documentation and Conservation. Vol. 7, 74-105. Atkins, Sue, & Rundell, Michael. 2008. The Oxford guide to practical lexicography. Oxford: OUP. Berg, R. van den. & Sidu, La Ode. 1996. English dictionary. Leiden: KITLV Press. Berg, R. van den. & Sidu, La Ode. 2000. Kamus Muna-Indonesia. Kupang: Artha Wacana Press. Biber, Douglas, & Barbieri, Federica. 2007. Lexical bundles in university spoken and written registers. English For Speciic Purposes, 26(3): 263-286. Biber, Douglas, Conrad, Susan, & Cortes, Viviana. 2004. If you look at. . .: Lexical bundles in university teaching and textbooks. Applied Linguistics, 25(3): 371-405. Budiwiyanto, Adi. Korpus dalam penyusunan kamus. http://badanbahasa.kemdikbud. go.id/lamanbahasa/artikel/1580 Diakses 1 Juli 2016. Budiwiyanto, Adi. Pendokumentasian bahasa dalam upaya revitalisasi bahasa daerah yang terancam punah di Indonesia. http://badanbahasa.kemdikbud.go.id/lamanbahasa/ artikel/1823. Diakses tanggal 16 Juni 2016. Cheng, Winnie. 2012. Exploring corpus linguistics: language in action. London and New York: Routledge. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 55 55 8/2/16 11:19 AM Collins , J. T. 2003. Asilulu-English dictionary. NUSA, Vol. 52-53. Jakarta: Pusat Kajian Bahasa dan Budaya Unika Atma Jaya. Cowie, A. P. 1999. English Dictionaries for Foreign Learners: A History. Oxford: OUP. Coxhead, Averil. 2000. A new academic word list. TESOL Quarterly, 34(2): 213-238. Darjowidjojo, Soenjono & John W.M. Verhaar (Ed.). 1983. Miscellaneous Studies in Indonesian and Languages in Indonesia, Part VII. NUSA, Vol. 15. Jakarta: Lembaga Bahasa Atma Jaya. Dardjowidjojo, Soenjono (Ed.). 1986. Miscellaneous Studies in Indonesian and Languages in Indonesia, Part VIII. NUSA, Vol. 25. Jakarta: Lembaga Bahasa Atma Jaya. Dardjowidjojo, Soenjono (Ed.). 1987. Miscellaneous Studies in Indonesian and Languages in Indonesia, Part IX. NUSA, Vol. 27. Jakarta: Lembaga Bahasa Atma Jaya. Davies, Williem. 2010. A grammar of Madurese. Berlin: Mouton de Gruyter. Donohue, Mark. 2009. A grammar of Tukang Besi. Berlin: Mouton de Gruyter. Elbar, Lambertus, Admojo, Wihadi, D., & Dominicus, Nanang. 1987. Struktur bahasa Baru. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Halim, Amran (Ed.). 1977. Miscellaneous studies in Indonesian and languages in Indonesia, Part II. NUSA, Vol. 3. Jakarta: Lembaga Bahasa Atma Jaya. Halim, Amran (Ed.). 1979. Miscellaneous studies in Indonesian and languages in Indonesia, Part VI. NUSA, Vol. 7. Jakarta: Lembaga Bahasa Atma Jaya. Himmelmann N.P. 1998. Documentary and descriptive linguistics. Linguistics 36: 161-195. Gardner, Dee, & Davies, Mark. 2014. A new academic vocabulary list. Applied Linguistics, 35(3): 305-327. Gilquin, Gaëtanelle, & Paquot, Magali 2007. Spoken features in learner academic writing: identiication, explanation and solution. Makalah disajikan pada Fourth Corpus Linguistics Conference, University of Birmingham. Granger, Sylviane, & Meunier, Fanny. 2008. Phraseology: an interdisciplinary perspective. Amsterdam/Philadelphia: John Benjamins. Hananto, Markus, I Made, & Kurnia, Nany Setyono. 2011. Frequency-based Indonesian word lists. Makalah disajikan pada The second AISOFOLL (Annual International Symposium of Foreign Language Learning) Jakarta. Hyland, Ken. 2008. As Can Be Seen : Lexical Bundles And Disciplinary Variation. English For Speciic Purposes, 27(1): 4-21. Johnson. 2016, 27 Feb. Je suis circonlexe: Why a minor iddling with French spelling causes such anguish, The Economist. http://www.economist.com/news/books-and- 56 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 56 8/2/16 11:19 AM arts/21693551-why-minor-fiddling-french-spelling-causes-such-anguish-je-suiscirconlexe Diakses 15 Juni 2016. Leech, Geoffrey. 2011. Frequency, corpora and language learning. Dalam Fanny Meunier, Sylvie De Cock, Gaëtanelle Gilquin & Magali Paquot (Ed.), A taste for corpora: in honour of Sylviane Granger (hal. 7-31). Amsterdam/Philadelphia: John Benjamins. Leech, Geoffrey, Rayson, Paul, & Wilson, Andrew. 2001. Word frequencies in written and spoken English. Harlow: Longman Pearson Education Limited. Lichield, John. 2016, 4 Feb. Circumlex: Uproar over France’s decision to implement 26-year-old reform of spelling rules: The accent is on caution in Education Ministry’s new guide for text books, The Independent. http://www.independent. co.uk/news/world/europe/french-grammar-uproar-over-decision-to-implement-26year-old-reform-of-spelling-rules-a6854441.html Diakses 15 Juni 2016. Manan, Umar, Amir, Zainuddin, Malano, Nasroel, Syafei, Anas, & Agustar Surin. 1986. Struktur bahasa Muko-Muko. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Martinez, Ron, & Schmitt, Norbert. 2012. A Phrasal Expressions List. Applied Linguistics, 33(3): 299-320. Moon, Rosamund. 1998. Fixed expressions and idioms in English: a corpus-based approach. Oxford: Clarendon Press. Napsin, Syahrul, Naning, Zainal Abidin, Abdullah, Slamet, Sjamsuddin, Sjafran, Arsyad Mohammad, & Tarmizi. 1980/1981. Morfologi dan sintaksis bahasa Rejang. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Nattinger, James R., & DeCarrico, Jeanette S. 1992. Lexical phrases and language teaching. Oxford: Oxford University Press. Nikelas, Syahwin, Asni Ayun, Zainil, Marah Rusmali, & Syofyan Adam. 1986. Struktur Bahasa Pekal. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Masindan, Dra., Sinar, Dra. T. Silvana, Zulkili, Drs., Muchtar, Drs. Muhizar, & Harahap, Dra. Oliviana. 1985. Kamus Melayu Langkat – Indonesia. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Paquot, Magali. 2010. Academic vocabulary in learner writing: from extraction to analysis. London: Continuum. Pawley, Andrew, & Syder, Frances Hodgetts. 1983. Two puzzles for linguistic theory: nativelike selection and nativelike luency. Dalam J. C. Richards & R. W. Schmidt (Ed.), Language and communication (hal. 191-226). New York: Longman. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 57 57 8/2/16 11:19 AM Poedjosoedarmo, Soepomo (Ed). 1977. Miscellaneous studies in Indonesian and languages in Indonesia, Part III. Vol. 4. Jakarta: Lembaga Bahasa Atma Jaya. Phil, Quick. 2007. A Grammar of the Pendau language of central Sulawesi, Indonesia. Canberra: ANU. Purwo, Bambang Kaswanti (Ed.). 1990. Miscellaneous studies in Indonesian and languages in Indonesia, Part X. NUSA, Vol. 32. Jakarta: Lembaga Bahasa Atma Jaya. Pusat Bahasa. 2008. Kamus Besar Bahasa Indonesia Pusat Bahasa (Edisi keempat). Jakarta: Gramedia. Rundell, Michael (Ed.). (2007). Macmillan English Dictionary for Advanced Learners (Edisi Kedua). Oxford: Macmillan Publishers Limited. Rundell, Michael, & Granger, Sylviane. 2007. From corpora to conidence. English Teaching professional(50): 15-18. Shin, Dongkwang, & Nation, Paul. 2008. Beyond single words: the most frequent collocations in spoken English. ELT Journal, 62(4): 339-348. Simpson-Vlach, Rita, & Ellis, Nick C. 2010. An academic formulas list: new methods in phraseology research. Applied Linguistics, 31(4): 487-512. Sofyan, Inghuong Alias, Kaseng, Syahruddin, Sikki, M., & Pepy, Patuko. 1979. Morfologi dan sintaksis bahasa Kaili. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Suharno, Ignatius (Ed.). 1977. Miscellaneous studies in Indonesian and languages in Indonesia, Part IV NUSA, Vol. 5. Jakarta: Lembaga Bahasa Atma Jaya. Sulaiman, Abu Bakar, Gani, A., & K., Syafri. 1986. Kosa kata bahasa Melayu Riau. 1986. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Troeboes, Maryanto, Sandi, Gambar, Abraham, Antonius, Porat, and Hana, Alfons. 1987. Morfologi dan sintaksis bahasa Komodo. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Verhaar, John W.M. (Ed.). 1975. Miscellaneous Studies in Indonesian and Languages in Indonesia, Part I. NUSA, Vol. 1. Jakarta: Lembaga Bahasa Atma Jaya. Verhaar, John W.M. (Ed.).1978. Miscellaneous studies in Indonesian and languages in Indonesia, Part V. NUSA, Vol. 6. Jakarta: Lembaga Bahasa Atma Jaya. West, Michael. 1953. A general service list of English words. Essex: Longman. Winchester, Simon. 2003. The meaning of everything: The story of the Oxford English Dictionary. Oxford: OUP. Xue, Gou-yi, & Nation, Paul. 1984. A University World List. Language Learning and Communication, 3(2): 215-229. 58 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 58 8/2/16 11:19 AM Survei Program Pengolah Korpus untuk Data Bahasa Indonesia dan Bahasa Daerah di Indonesia Prihantoro Universitas Diponegoro [email protected] Abstrak Paper ini membandingkan beberapa program pengolah korpus (Corpus Processing Tool) yang cocok digunakan oleh para linguis yang tidak memiliki pengetahuan komputasi (scripting, coding atau programming) sama sekali. pada dasarnya, program-program tersebut bisa dikategorikan dalam tiga tipe. Pertama, program bertipe free concordancer yang bisa memuat teks dan melakukan penelusuran berbasiskan kata kunci. Namun program seperti ini biasanya terbatas hanya untuk korpus mentah, dan bahasa-bahasa yang aksaranya sudah diromanisasi seperti bahasa inggris. Kedua, adalah program dengan fungsi NLP terbatas. AntConc memberikan kebebasan bagi para pengguna untuk melakukan anotasi. Namun sayang anotasi yang bisa dilakukan sangat sederhana, sebatas identiikasi lema dan kata. Untuk melakukan anotasi, teks harus dianotasi terlebih dahulu dengan program lain AnTag, lalu diproses dengan AntConc. Ini serupa dengan Xaira dan Wordsmith. Berbeda dengan program-program ini, Geuljabi memiliki lexical resource Bahasa Korea yang built in, sehingga user tidak harus berpindah program. Tapi dalam konteks bahasa Indonesia atau daerah, tetap saja program-program ini tidak cocok untuk bahasa Indonesia. Program yang cocok untuk bahasa bahasa di Indonesia adalah jenis yang ke tiga, yaitu memiliki fungsi-fungsi lengkap Natural Language Processing (NLP) seperti desain korpus, sistem aksara, varian ortograi, anotasi morfologi, semantik, dan sintaksis, seperti Unitex. Unitex telah teruji dalam desain serta pemrosesan korpus berbagai bahasa, termasuk bahasa-bahasa dengan aksara khusus dan tingkat kompleksitas linguistik yang beragam seperti free order language (Rusia), logographic language (Cina), agglutinative language (Korea), serta Consonant Skeleton/Semitic Language (Arab, Yahudi). Tidak seperti program lain, Unitex membebaskan user untuk mendesain resource-nya sendiri. Saat ini, sudah tersedia prototip lexical resource Bahasa Indonesia Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 59 59 8/2/16 11:19 AM (Prihantoro, 2011), digunakan pada Unitex, dan Bahasa Jawa, yang terus disempurnakan. Resource bahasa Indonesia (Kilgarriff, Reddy, Pomikálek, & Avinesh, 2010), berjenis non-morfologis, digunakan oleh (Kwary, 2013) yang bisa diaplikasikan pada AntWord Proiler. Dalam program-program komputasi korpus berbasiskan pendekatan machine learning atau stochastic, pengambilan keputusan dalam kasus-kasus tertentu diambil alih oleh sistem (misal, ambiguity resolution) yang bergantung pada reference corpus atau training corpus. Pada Unitex/Nooj, presisi analisis bergantung penuh pada resource (aksara, ortograi, morfologi, semantik, sintaksis) yang didesain oleh user, sehingga pengambil keputusan adalah user itu sendiri, bukan sistem. Meski terkesan rumit, kompleks dan labour-intensive, pendekatan ini dinilai lebih cocok untuk para linguis yang memang bertujuan mendeskripsikan fenomena linguistik berorientasi pada konteks. I. PENDAHULUAN Dalam linguistik korpus, paling tidak ada tiga ranah pengembangan kepakaran. Ranah pertama adalah mengenai bangunan korpus itu sendiri, yang meliputi pengumpulan data dan arsitektur korpus. Ranah ke dua adalah pengolahan korpus, mulai dari character recognition, tokenisasi, anotasi serta penelusuran dan ekstraksi informasi linguistik. Ranah ke tiga, adalah membaca hasil pengolahan korpus, yaitu concordance dan statisik (Mc Enery & Hardie, 2012). Paper ini memfokuskan pada ranah ke dua, yaitu pengolahan korpus. Ranah ini hingga saat ini didominasi oleh para ahli komputer, karena erat kaitannya dengan teknologii informasi sehingga membutuhkan kemampuan komputasi seperti scripting, programming, dan coding. Perhatikan beberapa program yang didedikasikan untuk BI seperti iPoS tagger (Farizki & Purwarianti, 2010), InaMorph (Pisceldo, Mahendra, Manurung, & Arka, 2008), MorphInd (Larasati, Kuboň, & Zeman, Indonesian Morphology Tool (MorphInd): Towards an Indonesian Corpus, 2011), yang penggunaanya menuntut penggunanya familier dengan metode komputasi. Peran linguis secara langsung dalam ranah ini sedikit sekali karena, 1) perangkat lunak yang digunakan membutuhkan kompetensi komputasi, 2) tidak banyak linguis yang memiliki kemampuan komputasi, dan 3) banyak linguis lebih tertarik pada bahasa pada konteks penggunaan (misal; pragmatik atau analisis wacana). Namun penulis berpendapat, bahwa untuk bahasa-bahasa di Indonesia, linguis perlu meningkatkan kontribusinya pada ranah ke dua tersebut, paling tidak untuk beberapa alasan ini. Pertama, beberapa program-program yang didesain para ahli komputer 60 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 60 8/2/16 11:19 AM menggunakan metode stokastik/probabilitas, dan membutuhkan input dari linguis agar kinerja program menjadi optimal. Ke dua, linguis yang membaca hasil concordance atau statistic juga akan terbantu karena korpus akan dianotasi terlebih dahulu. Ke tiga, computing resource untuk bahasa Indonesia atau bahasa-bahasa daerah di Indonesia bisa dikatakan sangat sedikit. Khusus untuk bahasa-bahasa daerah, linguis agak sulit berkontribusi dalam ranah korpus ini, karena program-program yang sudah ada didesain khusus untuk satu bahasa. Solusi untuk permasalahan ini adalah 1) para programmer perlu menyederhanakan desain program yang mereka buat agar cukup leluasa digunakan oleh para linguis, bahkan yang tidak memiliki kemampuan programming. 2) Program tersebut haruslah memberikan keleluasan bagi para linguis untuk berkreasi sesuai dengan itur bahasa yang mereka analisis. Untuk mencari solusi permasalahan tersebut ada dua pilihan; 1) membuat sendiri program yang memenuhi kriteria tersebut, atau 2) menggunakan program yang sudah ada. Solusi pertama tentu lebih baik, namun membutuhkan waktu yang lama. Program seperti ini biasanya berupa proyek tim dengan dana yang tidak sedikit. Namun kelebihannya adalah kita bisa mendesain sendiri, itur-itur apa saja harus dimiliki program tersebut, yang disesuaikan dengan bahasa yang akan dianalisis. Pengguna, yang memiliki kemampuan programming, juga bisa langsung menggunakan bahasa pemrograman yang biasa digunakan untuk fungsi Natural Language Processing, seperti Perl atau Phython. Pada pengolahan korpus dengan bahasa pemrograman seperti Phyton (Bird, Klein, & Loper, 2009), wordlist harus ‘dipanggil’ dengan perintah yang kompleks.Perhatikan perintah berikut dari Python yang digunakan untuk mencari wordlist (daftar token) pada korpus: >>> from nltk.corpus import PlaintextCorpusReader >>> corpus_root = ‘/usr/share/dict’ >>> wordlists = PlaintextCorpusReader(corpus_root, ‘.*’) >>> wordlists.ileids() [‘README’, ‘connectives’, ‘propernames’, ‘web2’, ‘web2a’, ‘words’] Perintah di atas bisa diterjemahkan sebagai berikut. 1) gunakan modul korpus untuk mengenali format korpus *txt, 2) temukan direktori/lokasi korpus pada hard-drive, 3) kenalii semua kata pada korpus, 4) tampilkan daftar kata pada layar. Tentu saja bagi orang yang menguasai dasar-dasar pemrograman, perintah di atas cukup sederhana. Paper ini memfokuskan pada solusi yang ke-dua. Hal ini dikarenakan ternyata ada beberapa program, yang dihasilkan oleh programmer yang juga linguis. Sehingga, program-program ini mampu mengakomodasi kepentingan linguis. Pada bagian pembahasan, kami akan menjelaskan hasil survey kami mengenai kelebihan dan kekurangan program-program tersebut. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 61 61 8/2/16 11:19 AM II. KERANGKA TEORI DAN METODE Jenis-jenis tools, atau program pengolah korpus dijelaskan dengan baik dan runtut oleh Mc Enery & Hardie (2012). Di dalam penjelasan tersebut, secara historis, program pengolah korpus terbagi menjadi empat. Generasi pertama adalah concordancer yang eksklusif di satu pusat penelitian. Generasi kedua adalah concordancer yang sudah didistribusikan secara umum, namun fungsi penelusuran korpus beranotasi belumlah maksimal. Generasi ke tiga adalah concordancer yang mampu mengolah korpus beranotasi secara maksimal dan dilengkapi fungsi-fungsi statistik dan dekskriptif. Generasi ke empat secara fungsionalitas sebetulnya tidak terlalu berbeda dengan generasi ke tiga. Kemunculan concordancer generasi ke empat ini memfokuskan pada masalah 1) kompatibilitas PC, dan 2) distribusi korpus secara legal. Sehingga muncullah concordancer online yang bisa diakses tanpa batasan spesiikasi minimal apapun, dan mampu memberikan akses terhadap korpus-korpus yang datanya bebas digunakan. Namun dalam paper ini, survei yang dilakukan memfokuskan pada tool yang berfungsi secara ofline dan dapat memproses korpus-korpus personal. Perbedaan selanjutnya adalah bahwa penggolongan tipe program korpus adalah berdasarkan fungsionalitasnya. Metode penelitian yang digunakan adalah observasi partisipatoris. Penulis tidak hanya menggunakan referensi seperti kajian yang sudah dilakukan dengan tool tersebut atau manual yang ada, namun juga menggunakan tool tersebut. Dari pengalaman empiris itu, maka dirumuskanlah tiga tipe tool berdasarkan derajad fungsionalitas mereka. III. PEMBAHASAN 3.1 Tipe 1: Concordancer Murni Program yang digolongkan pada tipe pertama adalah free concordancer (seperti Simple Concordancer1 atau TextStat2), yang banyak sekali tersebar di internet dan bisa didownload secara gratis. Namun program seperti ini hanya bisa mengolah korpus mentah. Program ini sangat sederhana interface dan pengoperasiannya, sehingga biasa digunakan dalam kelas pengenalan linguistik korpus. User biasanya hanya harus mengupload teks berformat txt, lalu penelusuran berbasiskan ortograi bisa dilakukan. Selama karakter dari bahasa yang dianalisis sudah bisa dikenali, concordancer ini bisa digunakan. Meski kami menggunakan program free concordancer untuk pemula, namun para linguis korpus tingkat mahir juga bisa menggunakan program ini untuk analisisnya apabila kajian korpus yang dilakukan hanya membutuhkan korpus mentah. 1 2 62 http://www.textworld.com/scp/ http://neon.niederlandistik.fu-berlin.de/en/textstat/ Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 62 8/2/16 11:19 AM Gambar 1. Concordance dari Simple Concordance Program 3.2 Tipe 2: Korpus Prosesor dengan Fungsi Statistik, Deskriptif dan NLP Terbatas Program tipe ke dua, adalah program-program yang sudah memiliki fungsi-fungsi NLP namun masih perlu dikembangkan lebih lanjut. Salah satu contohnya adalah AntConc3. AntConc adalah salah satu program yang ditulis oleh Dr. Lawrence Anthony. Menurut penulis, inilah program yang user-interfacenya sangat baik, dan mudah untuk dipelajari. AntConc banyak digunakan dalam pengolahan korpus mentah baik oleh para pemula maupun tingkat mahir. Di dalam link yang bisa didownload terpisah, AntConc menyediakan lemma list, modul lematisasi (mirip dengan stemming, atau lebih tepatnya lemmatizing dalam istilah komputasi) untuk bahasa inggris yang struktur datanya sangat sederhana. Modul ini digunakan untuk mengidentiikasi bentuk inleksi dan derivasi dari satu lema dan menghitung frekwensinya, atau bentuk kontraksi. Lemma List pada AntConc berisi daftar lema dan daftar word form dengan notasi sebagai berikut: lema -> wordr form1, word form2, word form3. Tujuan dari lemma list ini sendiri adalah menunjukan varian word form yang terdeteksi dalam teks yang kita analisis. Anda bisa mendownload lemma list di sini (http://www.laurenceanthony.net/software/antconc/). Jika dibuka, ile berformat .txt tersebut akan nampak seperti ini: 3 http://www.laurenceanthony.net/software/antconc/ Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 63 63 8/2/16 11:19 AM abandon -> abandons,abandoning,abandoned abase -> abases,abasing,abased abate -> abates,abating,abated abbess -> abbesses abbey -> abbeys Untuk menggunakan lemma list ini, klik tool preferences > wordlist. Pada lemma list, telusuri ile lemma list sesuai dengan folder dimana anda menyimpan ile tersebut. Lalu klik Load. Pada word list range, pilih use all words. Pada pilihan add words from ile, klik open lalu telusuri ile lemma list yang sama pada folder tersebut. Jika semua sudah selesai, klik apply. Setelah itu, klik start pada kotak penelusuran. Gambar 2. Daftar Lema dan Wordform pada AntConc Kita lihat kolom word telah berubah menjadi lemma. Sedangkan kolom lemma word forms yang tadinya kosong telah terisi sebagian. Kenapa cuma sebagian? Mari kita telusuri cara berpikir komputer. Pertama, komputer mendeteksi token yang ada dalam teks. Ke dua, komputer akan memeriksa, apakah ada dari beberapa token yang merupakan word form dari satu lema yang sama. Apabila ada, maka hasilnya akan ditampilkan. Contoh pertama, komputer mendeteksi token a sebanyak 14 dan token an sebanyak 10. Setelah berkonsultasi dengan lemma list, ia mengetahui bahwa dua token tersebut berasal dari satu lema, a (a -> an). Sehingga ditampilkanlah a pada kolom lemma, serta a 14 an 10 pada lemma word form(s). Contoh ke dua, komputer menemukan token-token berikut am 1 are 3 be 23 been 7 is 7 was 4. Setelah berkonsultasi dengan lemma list, ia menemukan bahwa ke enam token tersebut berasal dari satu lema be (be -> am,ar e,is,was,were,being,been,’m,m). Perhatikan bahwa dalam lemma list ada 9 jenis word form. Namun karena yang terdeteksi di teks hanya enam, maka enam token itulah yang ditampilkan.Dengan meniru format modul lemma list untuk bahasa Inggris, kita bisa membuat lemma list yang sama untuk bahasa Indonesia. Berikut contoh struktur data lemma list untuk bahasa Indonesia 64 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 64 8/2/16 11:19 AM [daftar lemma list untuk bahasa Indonesia [masih belum lengkap, bisa dikembangkan lebih jauh [entry line sbb [lemma_->_word_form1,word_form2,word_form3 makan -> makan,memakan,dimakan,termakan jalan -> jalan,berjalan,menjalani,dijalani,jalankan juang -> berjuang Selain, AntConc, Dr. Anthony juga membuat beberapa program terpisah seperti AntTag, yang berfungAntTag, yang berfungsi melakukan anotasi. Ini agak berbeda dengan Xaira dan Wordsmith yang menggabungkan fungsi anotasi dalam satu program. Karena menggunakan tagger CLAW BNC, AntTag hanya bisa menganotasi teks berbahasa Inggris. Teks harus diupload dan dianalisis oleh AntTag terlebih dahulu, lalu dicopy-paste sebagai ile txt, dan diupload ke AntConc untuk dianalisis. Setelah ditag dan diupload, user bisa melakukan peneluran berbasiskan tag yang ada. Bisa juga user mengupload korpus yang sudah bertag, misalnya korpus UI-1M dari Pan Localization Project berikut: Gambar 3. Penelsuran Tag Korpus UI-1M menggunakan AntConc Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 65 65 8/2/16 11:19 AM Selain AntTag ada juga AntWordProiler, program statistik yang mirip seperti program Range yang dibuat oleh Prof. Paul Nation, yang berfungsi mengukur derajat eksistensi sekelompok kata dalam satu teks. Permasalahannya adalah, struktur data lexical resource yang digunakan pada AntWordProiler berbeda dengan lemma list pada AntConc, sehingga data harus ditulis ulang dengan format yang berbeda. Kemudian ada WordSmith4 dan Xaira5. WordSmith dan Xaira memiliki beberapa fungsi statistik seperti T-Score, Mutual Information, atau loglikelyhood yang lebih advance dari AntConc. Serupa dengan AntConc, text harus diPOStag dulu dengan program lain (atau manual, tapi tidak disarankan), sebelum diproses lebih jauh. Namun menurut hemat penulis, AntConc jauh lebih mudah digunakan dibanding Xaira dan Wordsmith. Geuljabi, adalah sebuah program analis korpus buatan National Korean Institute of Korean Language (Badan Bahasanya Korea). Tidak seperti AntConc, Xaira atau Wordsmith, Geuljabi memiliki beberapa keistimewaan. Pertama, Geuljabi memiliki Lexical Resource (LR) tersendiri yang sudah built-in. User tidak harus berpindah ke program lain (apalagi menganotasi secara manual) untuk melakukan tagging pada korpus. Kedua, tagging pada korpus sampai ke level morfologis. Gambar 4. Penelurusan Classiier Menggunakan Gelujabi 4 5 66 http://www.lexically.net/wordsmith/version5/index.html http://xaira.sourceforge.net/ Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 66 8/2/16 11:19 AM Namun, Geuljabi memiliki beberapa kelemahan yang cukup mendasar. Penulis hanya berhasil menggunakan Geuljabi di OS berbahasa Korea (Korean Windows). Kemudian, teks yang dianalisis tidak bisa terlalu banyak; karena akan menimbulkan crash pada system. Dalam konteks kebutuhan bahasa Indonesia atau daerah, tentu saja Geuljabi terbatas seperti tipe 1, karena LR yang ada tidak bisa digunakan untuk bahasa Indonesia. Meski demikian, bagi peneliti bahasa Korea, Geuljabi adalah program yang sangat baik dan cukup nyaman digunakan oleh para linguis Korea karena user interface yang sederhana dan mudah dipahami (oleh orang yang paham bahasa Korea tentunya). 3.3 Tipe 3: Korpus Prosesor dengan Fungsi NLP Optimal Program tipe ke-tiga memiliki fungsi-fungsi NLP dasar yang lengkap, namun masih cukup ramah untuk digunakan tanpa kemampuan programming atau scripting. Contoh program seperti ini adalah Intex6, Unitex7, dan NooJ8. Pengguna dapat saja langsung mempelajari program ini, namun penulis menyarankan menguasai concordancer terlebih dahulu, lalu AntConc, dan baru menuju Unitex, Intex, atau Nooj. Pada sebuah program kita sering melihat ada nama ekstensi seperti versi beta, versi 1.2, versi 2.2 dan sebagainya. Versi beta maksudnya adalah program tersebut masih dalam percobaan. Sedangkan penomoran digunakan untuk membedakan versi lebih baru dan yang lama. Versi yang lebih baru biasanya lebih baik dari versi yang lama, baik dalam hal penambahan fungsi, atau aspek lain seperti tampilan atau kecepatan. Khusus untuk Intex, saat ini sudah tidak dikembangkan lagi. Unitex dan Intex dikembangkan tidak hanya oleh programmernya, tapi juga dengan bantuan komunitasnya. Terkadang, komunitas pengguna inilah yang memberikan input mengenai itur yang harus dikembangkan baik untuk pengajaran, analisis, maupun teknologi informasi. Pada kedua program ini, sistem program dan modul linguistik adalah dua hal yang berbeda. Program hanya menjalankan fungsi-fungi dasar NLP seperti manajemen korpus, tokenisasi, desain lexical resource, machine readable grammars, automatic retrieval, information extraction, collocation score dan sebagainya. Sedangkan modul linguistik pada ke dua program ini bisa didesain secara bebas oleh para penggunanya. Dengan demikian, kita tidak perlu mengacu pada tag standar Bahasa Inggris. Unitex dan Nooj didesain dengan prinsip bahwa setiap bahasa memiliki keunikan tersendiri, sehingga modul linguistik yang digunakan bisa berbeda antara satu bahasa dan bahasa lain. Bahkan dalam bahasa yang sama, pengguna bisa memberikan kode yang berbeda sesuai dengan pendapatnya. Contohnya, preix berkode anotasi PFX pada pengguna pertama. Pengguna lain bisa saja mendesain kode anotasi yang 6 7 8 http://www.nyu.edu/pages/linguistics/intex/ http://www-igm.univ-mlv.fr/~unitex/ http://www.nooj-association.org/ Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 67 67 8/2/16 11:19 AM berbeda, misalnya PREF. Misalkan dalam satu bahasa daerah di Papua, seorang linguis berargumen bahwa classiier +HUMAN bisa mendeskripsikan benda mati seperti mobil atau pesawat terbang, sehingga anotasi +Hum diberikan. Namun linguis lain berpendapat, bahwa sebetulnya konsep yang tepat adalah mobilitas, sehingga seharusnya +Mob yang harus melekat pada classiier tersebut. Gambar 5. Contoh Lexical dan Grammatical Resources untuk Preiks Bahasa Indonesia dengan Unitex (Prihantoro 2011) Gambar 6. Derivational Grammar Resource untuk Bahasa Indonesia dengan Nooj 68 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 68 8/2/16 11:19 AM Gambar 7. Parse Tree untuk Kalimat Bahasa Indonesia dengan Nooj Sistem distribusi/sharing modul linguistik juga sangat sederhana yaitu dengan mengupload folder yang berisi modul tersebut atau mengirimkannya melalui email. Folder tersebut bisa didownload lalu dicopy ke direktori pada lokasi modul linguistik tersebut digunakan. Bahkan bisa juga hanya dicopy-paste. Tantangan utama untuk pemrosesan bahasa daerah adalah pada bahasa-bahasa yang memiliki aksara tersendiri seperti aksara Hanacaraka (Bahasa Jawa), Aksara Kaganga (bahasa Lampung), atau aksara lain, karena sistem harus mendesain sistem font recgnition. Hal ini akan menjadi lebih mudah, apabila sudah terdapat encoding font Unicode untuk bahasa tersebut. Namun hal ini sepertinya tidak menjadi masalah, karena kedua program ini sudah berhasil memproses bahasa bahasa dengan aksara tersendiri, misalnya bahasa Arab yang ditulis dari kiri ke kanan dengan atau tanpa diakritik, bahasa Korea yang menggunakan system syllable block dan berjenis aglutinatif, bahasa Cina yang bertipologi isolated language dengan sistem karakter logograik dan bahasa lainnya. Khusus untuk hal ini, jika tidak memiliki kemampuan programming, pengguna tidak bisa melakukannya sendiri. Namun pengguna bisa meminta bantuan programmer kedua program ini atau komunitasnya. Berikut kami tampilkan estimasi penguasaan ke-tiga jenis program yang telah dibahas sebelumnya. Untuk Unitex/Nooj, pengguna bisa memangkas waktu kurang lebih dua jam apabila sudah menguasai AntConc, WordSmith, Xaira atau program sejenis. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 69 69 8/2/16 11:19 AM WordSmith/Xaira/ Geuljabi 30 menit 5 jam Easy Advanced ✔ Download dan ✔ download dan instalasi instalasi ✔ manajemen teks ✔ Manajemen teks korpus korpus ✔ penelusuran ✔ Penelusuran automatis automatis berbasiskan berbasiskan ortograi ortograi ✔ kompleksitas: ✔ Deskripsi tag regular anotasi bahasa grammar sasaran (Inggris/ ✔ contoh analisis Korea) ✔ praktek ✔ Penelusuran automatis berbasiskan tag ✔ Statistik ✔ Visualisasi data ✔ Kompleksitas: regular grammar, context-free grammar ✔ Contoh analisis ✔ Praktek Concordancer AntConc 2 jam Intermediate ✔ download dan instalasi ✔ Manajemen teks korpus ✔ Penelusuran automatis berbasiskan ortograi ✔ Statistik ✔ Visualisasi data ✔ Kompleksitas: regular grammar ✔ Contoh analisis ✔ Praktek Unitex/Intex/Nooj 8 Jam Advanced ✔ download dan instalasi ✔ Manajemen teks korpus ✔ Penelusuran automatis berbasiskan ortograi ✔ Deskripsi tag anotasi bahasa sasaran (gramatika, semantik, morfologi) ✔ Desain Lexical Resource ✔ Penelusuran automatis berbasiskan tag ✔ Statistik ✔ Visualisasi data ✔ Desain lexical resource (lexicosemantic) ✔ Machine readable grammars (inleksi/derivasi, sintaksis) ✔ Output Variable and Context ✔ Kompleksitas: regular grammar, context free grammar, context- sensitive grammar ✔ Contoh analisis ✔ Praktek Tabel 1. Estimasi Penguasaan Fungsi Dasar Program Pengolah Korpus 70 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 70 8/2/16 11:19 AM IV. SIMPULAN Meski dalam paper ini penulis membahas mengenai software atau tool pengolahan korpus, namun penulis berharap user tidak ‘silau’ dengan kecanggihan software atau tool tersebut. Pertama, dalam dunia komputer, software ataui tool akan terus berkembang dan bukan tidak mungkin akan muncul tool atau software baru yang lebih baik. Ke dua, ini yang paling penting, tool atai software tadi tidak bisa beroperasi maksimal tanpa resource yang memadai, khususnya leksikon. Mengapa leksikon? Desain leksikon membutuhkan, selain ketelitian, juga tenaga, karena kuantitasnya yang cukup besar, dan idealnya memang dihandle oleh tim, bukan perseorangan. Sejauh ini, kalangan yang banyak mempublikasi computational resource untuk bahasa Indonesia berasal dari kalangan ahli komputer, bukan linguis. Ada beberapa linguis yang menganggap bahwa resource adalah satu reference work, dan tidak bisa dianggap sebagai sebuah karya akademis, karena tidak mendeskripsikan fenomena ‘menarik’ secara khusus seperti voice, transitivity, morphological mirroring dan sebaginya. Meski masih debatable, hal ini seharusnya tidak mematikan niat mereka yang ingin menulis resource ini baik lexical/grammatical resource. Perlu dipahami bahwa setiap area linguistik perlu mendapatkan perhatian, karena memberikan kontribusi penting bagi bahasa itu sendiri. Hal ini bisa dilakukan tanpa menegasikan kontribusi area yang lain. Dalam analisis Dalam bidang leksikograi, terutama electronic lexicography, membuat resource adalah kontribusi yang sangat positif. Penulis berpendapat, selain paper-paper atau laporan mengenai sistem fonetik, morfologi, sintaksis suatu bahasa, perlu juga didesain resource komputasi yang memadai. Hal ini juga berlaku untuk bahasa Indonesia maupun daerah. Daftar Pustaka Anthony, L. (2006). Concordancing with AntConc: An introduction to tools and techniques in corpus linguistics. JACET Newsletter, 155-185. Bird, S., Klein, E., & Loper, E. (2009). Natural Language Processing with Phyton. Sebastopool: O’Reilly Publishing. Farizki, A., & Purwarianti, A. (2010). HMM Based Part-of-Speech Tagger for Bahasa Indonesia. On Proceedings of 4th International MALINDO (Malay and Indonesian Language) Workshop, 2nd August 2010 (pp. 123-45). Jakarta: Universitas Indonesia Press. Gross, M. (1997). The Construction of Local Grammars. In E. Roche, & Y. Schabes, Finite State Language Processing (pp. 329-354). Massachusetts: MIT Press. Kilgarriff, A., Reddy, S., Pomikálek, J., & Avinesh, P. (2010). A Corpus Factory for Many Languages. In LREC. LREC, (pp. 27-34). Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 71 71 8/2/16 11:19 AM Kwary, D.-A. (2013). Indonesian High Frequency Words. Retrieved August 20, 2013, from The Indonesian High Frequency Word List (Version April 2013).: http://www. kwary.net/iwl.html Larasati, S.-D. (2012). IDENTIC CORPUS: Morphologically Enriched IndonesianEnglish Parallel Corpus. LREC, 902-906. Larasati, S.-D., Kuboň, V., & Zeman, D. (2011). Indonesian Morphology Tool (MorphInd): Towards an Indonesian Corpus. Systems and Frameworks for Computational Morphology (pp. 119-129). Zurich, Switzerland: Springer Berlin Heidelberg. Lewis, M.-P., Simons, G.-F., & Fennig, C.-D. (2013). Ethnologue: Languages of the World, Seventeenth edition. Dallas, Texas: SIL International. Mc Enery, T., & Hardie, A. (2012). Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press. Paumier, S. (2008). Unitex Manual. Paris: Universite Paris Est Marne La Valee & LADL. Pisceldo, F., Mahendra, R., Manurung, R., & Arka, I.-W. (2008). A Two Level Morphological Analyser for the Indonesian Language. Australasia Technology Association Workshop, (pp. 142-150). Prihantoro. (2011). Transducer for Auto-Convert of Archaic to Present Day English: A Support for Computer Assisted Language Learning. Proceeding for The 16th English in Southeast Asia Conference. Yogyakarta: Sanata Dharma University Press. Prihantoro. (2011b). Local Grammar Based Auto Preixing Model for Automatic Extraction in Indonesian Corpus (Focus on Preix MeN-). Proceedings of International Congress of Indonesian Linguists Society (KIMLI) (pp. 32-38). Bandung: Universitas Pendidikan Indonesia Press. Traboulsi, H. (2009). Arabic Named Entity Extraction: A Local Grammar Based Approach. Proceedings of the International Multiconference Science and Information Technology (pp. 139-143). Mragowo, Poland: Polish Information Processing Society. Wicaksono, A.-F., & Purwarianti, A. (2010). HMM Based Part-of-Speech Tagger for Bahasa Indonesia. Proceeding of the Fourth International MALINDO Workshop (MALINDO2010). Jakarta: Malindo Press. 72 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 72 8/2/16 11:19 AM Komputasi Linguistik untuk Penyusunan Kamus Bahasa Daerah: Studi Kasus Bahasa Sunda Dadan Sutisna Yayasan Kebudayaan Rancagé [email protected] Abstrak Usaha memantapkan dan menyebarluaskan bahasa daérah seyogianya dilaksanakan secara terencana dan berkesinambungan, bukan hanya melalui pendidikan dan pengajaran, melainkan juga melalui penulisan pelbagai jenis buku dalam bidang tata bahasa, ejaan, peristilahan, kesusastraan, dan penyusunan serta penerbitan kamus bahasa Sunda dengan berbagai format. Dengan terbitnya pelbagai jenis kamus, khazanah dan prestise bahasa daérah juga dikukuhkan dalam bidang léksikograi, sebab dalam kebudayaan cetak modérn, kamus merupakan alat dan lambang sekaligus martabat sebuah bangsa. Di Indonésia, penyusunan kamus menggunakan perangkat lunak yang dibuat sendiri belum pernah ada. Sementara perangkat lunak yang dibuat oleh pihak luar tidak sepenuhnya memahami karakteristik bahasa daérah di Indonésia. Kamus dapat disusun dengan cepat, tepat, dan akurat, jika menggunakan perangkat lunak berbasis komputasi linguistik. Peranan komputasi linguistik sangat penting karena berhubungan dengan éféktiitas pencarian, analisis, pengolahan, dan pemaknaan suatu bahasa. Ini adalah tuntutan nyata untuk setiap bahasa, di mana manusia tidak hanya menginginkan bantuan dalam mekanik, tetapi juga dalam upaya intelektual. Makalah ini akan menjelaskan upaya yang pernah dilakukan dalam penyusunan Kamus Utama Bahasa Sunda (KUBS) sebanyak 150.000 éntri. Kamus ini disusun menggunakan sebuah perangkat lunak yang dibuat oleh Yayasan Kebudayaan Rancagé, dan sudah mengahasilkan kamus dalam bentuk cetak setebal lebih dari 6.000 halaman. KUBS menggunakan lebih dari lima juta halaman dokumén berbahasa Sunda sebagai sumber, terdiri dari 2.000 buku Sunda dan belasan ribu média berbahasa Sunda. Metodologi dalam penyusunan kamus ini adalah Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 73 73 8/2/16 11:19 AM sebagai berikut: (1) Digitalisasi untuk memindahkan sumber-sumber cetak ke dalam format digital, dan disimpan dalam sebuah database; (2) Idéntiikasi dan validasi sumber; (3) Otomatisasi kalimat, yaitu pemecahan téks sumber menjadi kalimat; (4) Otomatisasi korpus berdasarkan téks yang tersimpan dalam database; (5) Penyusunan déinisi oléh léksikograf menggunakan reférénsi database; (6) Pengalihan hasil déinisi ke dalam format ebook; (7) Pencetakan kamus. Dengan demikian, semua lema, sublema, deinisi, contoh kalimat, sumber rujukan, dan data-data lainnya disimpan secara sistematis dalam pangkalan data. Hal ini memudahkan dalam pencarian dan penyajian kamus, serta secara otomatis akan terbentuk versi kamus digital. Ke depan, kamus ini dapat dikembangkan menjadi kamus elektronik berbasis internet dan telepon pinyar, juga dibuat dalam bentuk aplikasi text to speech untuk dialek serta idiom bahasa daérah. I. PENDAHULUAN 1.1 Latar Belakang Usaha melestarikan dan menyebarluaskan bahasa daerah seyogianya dilaksanakan secara terencana dan berkesinambungan, bukan hanya melalui pendidikan dan pengajaran, melainkan juga melalui penulisan pelbagai jenis buku dalam bidang tata bahasa, ejaan, peristilahan, kesusastraan, dan penyusunan serta penerbitan kamus bahasa daerah dalam berbagai format. Dengan terbitnya pelbagai jenis kamus, khazanah dan prestise bahasa daerah juga dikukuhkan dalam bidang leksikograi, sebab dalam kebudayaan cetak modern, kamus merupakan alat dan lambang sekaligus martabat sebuah bangsa. Penyusunan kamus yang lengkap dan komprehensif tak hanya membutuhkan leksikograf yang handal, tetapi harus ditunjang pula oleh metodologi yang tepat. Sebelum era komputer, kamus disusun menggunakan sistem kartu. Dan saat ini, meskipun teknologi informasi telah merambah berbagai bidang, peranan komputer belum optimal dalam leksikograi. Komputer baru digunakan untuk pengurutan, pencarian, dan penyimpanan data kamus, sementara kajian analisis kebahasaannya masih terabaikan. Selain itu, kendala dalam penyusunan kamus terdapat pada proses pemilihan katakata yang akan dimasukkan menjadi entri kamus. Selama ini, entri kamus seolah-olah ditentukan oleh ahli bahasa, sehingga mungkin saja ada kata-kata yang dibuang. Padahal tugas leksikograf adalah mencatat kata-kata, bukan menentukan kata yang paling tepat. Dalam penyusunan kamus bahasa asing, masalah seperti ini sudah teratasi sejak satu setangah abad silam. Simon Winchester menjelaskan bahwa kamus adalah “inventaris 74 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 74 8/2/16 11:19 AM bahasa” dan sama sekali bukan panduan untuk menggunakan bahasa itu dengan baik. Tugas para penyusunnya bukanlah memilah-milah kata yang akan dimasukkan berdasarkan apakah kata itu bagus atau jelek (2007:155). 1.2 Masalah Penyusunan kamus bahasa daerah umumnya menghadapi kendala dalam pengumpulan kata-kata yang akan dijadikan lema atau entri kamus. Untuk menerbitkan sebuah kamus yang lengkap memerlukan waktu belasan sampai puluhan tahun—seperti yang terjadi pada bahasa Sunda. Akibat dari lamanya proses tersebut, kamus tidak lagi mencerminkan bahasa kekinian, karena kata-kata suatu bahasa telah berubah atau bertambah setelah kamus tersebut terbit, sehingga hanya memuat entri yang disusun bertahun-tahun silam. Masalah lain dalam pengembangan bahasa daerah—juga bahasa Indonesia, para ahli belum memanfaatkan ilmu komputer secara maksimal. Dukungan komputer dalam penyusunan kamus, hanya sebatas hal-hal dasar seperti penyimpanan dan pengurutan kata-kata. Sementara analisis linguistiknya belum berbasis komputerisasi. Setiap bahasa memiliki keunikan tersendiri, sehingga aplikasi komputer untuk mengolah bahasa tersebut harus dibuat khusus. Saat ini memang cukup banyak aplikasi komputer yang berkaitan dengan linguistik, tetapi sebagaian besar untuk bahasa asing, dan tentu tidak optimal jika digunakan untuk bahasa-bahasa daerah. Di Indonesia, bidang komputasi linguistik belum begitu mendapat perhatian. Padahal Indonesia merupakan negara dengan bahasa terbanyak kedua setelah Papua Nugini. Selain bahasa Indonesia sebagai bahasa nasional, terdapat ratusan bahasa ibu yang tersebar dari Sabang sampai Merauke. Kendala yang paling nyata ialah karena komputasi linguistik merupakan bidang ilmu mutidisipliner, yang memerlukan pemahaman dalam bahasa dan kepiawaian dalam ilmu komputer (informatika). Tidak banyak yang menguasai kedua bidang ini secara bersamaan, sementara kita juga belum bisa menyatukan ahli bahasa dengan ahli komputer untuk bekerjasama. 1.3 Tujuan Tujuan pengembangan komputasi linguistik untuk bahasa daerah antara lain: 1. Meningkatkan fungsi bahasa daerah dalam bidang teknologi informasi. 2. Menyediakan rujukan atau pegangan baku, terutama yang sejalan dengan bahasa daerah yang hidup (living language) di tengah masyarakat, dalam rangka memelihara, melestarikan dan mengembangkan bahasa daerah. 3. Menggugah dan mengembangkan kebanggaan masyarakat terhadap bahasa dan budayanya sendiri sebagai sumber identitas dan kreativitas bersama dalam upaya menghadapi berbagai perubahan dalam kehidupan bersama di kemudian hari. 4. Memelihara dan melanjutkan keragaman bahasa (language diversity) dan keragaman budaya (cultural diversity) di Indonesia, terutama sehubungan dengan Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 75 75 8/2/16 11:19 AM adanya gejala di tingkat global yang menunjukkan bahwa keragaman tersebut cenderung menyusut. 5. Mengukuhkan dan memantapkan bahasa daerah sebagai bahasa ilmu pengetahuan dan kebudayaan dalam makna yang seluas-luasnya. 6. Sebagai salah satu kekayaan bahasa yang dimiliki Bangsa Indonesia yang harus tetap dijaga keberadaannya sebagai bukti keberadaan Bangsa Indonesia yang besar dan beragam. 1.4 Tinjauan Pustaka Hingga saat ini, menurut pengamatan penulis, belum ada penelitian yang secara khusus mengkaji komputasi linguistik dalam bahasa daerah sebagai rujukan awal penyusunan kamus. Sudiroatmadja (1993) dalam penelitiannya menyinggung tentang morfologi generatif dalam pembentukan kata bahasa Jawa melalui metode komputasi, tetapi penelitian tersebut sudah cukup lama serta tidak ada kaitannya dengan penyusunan kamus. II. LANDASAN TEORI DAN METODE PENELITIAN Sebagai menjadi mesin pencari nomor satu di Internet, Google menerapkan komputasi linguistik yang disempurnakan setiap saat. Tampilannya sederhana, tetapi di balik itu, dipenuhi algoritma kompleks berkaitan dengan bahasa, untuk memberikan hasil pencarian yang lebih mendekati keinginan pengunjung. Google menganalisa setiap teks yang diketik oleh pengunjung, mencocokannya dengan indeks pada basis data, memperbarui kesalahan ejahan, dan berusaha memahami setiap bahasa yang digunakan oleh pengunjung. Kerumitan suatu bahasa ternyata sedikit demi sedikit dapat dipecahkan oleh komputer, dan Google melakukannya dengan membuat kelompok penerjemah terbesar di dunia. Komputasi linguistik merupakan penggabungan antara ilmu bahasa dan ilmu komputer melalui pemodelan statistik berdasarkan aturan bahasa alami dari perspektif komputasi. Secara sederhana, komputasi linguistik dapat digambarkan sebagai upaya untuk mengajarkan komputer agar dapat berkomunikasi dengan manusia, memecah persoalan ambiguitas bahasa menjadi sesuatu yang realitis. Prinsip kerja komputer hampir mirip dengan otak manusia, maka para ahli psikolinguistik mulai mengkaji dan berusaha menciptakan sebuah sistem yang memungkinkan komputer berbahasa seperti manusia atau menerjemahkan bahasa manusia (Yendra 2016); Menurut Hans Uszkoreit (2000), komputasi linguistik adalah disiplin antara linguistik dan ilmu komputer yang berurusan dengan pemodelan statistik berdasarkan aturan bahasa alami dari perspektif komputasi. Secara sederhana, komputasi linguistik dapat digambarkan sebagai upaya untuk mengajarkan komputer agar dapat berkomunikasi dengan manusia, memecah persoalan ambiguitas bahasa menjadi sesuatu yang realistis. Komputasi linguistik berhubungan dengan efektiitas pencarian, analisis, pengolahan, 76 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 76 8/2/16 11:19 AM dan pemaknaan suatu bahasa. Ini adalah tuntutan nyata untuk setiap bahasa, di mana manusia tidak hanya menginginkan bantuan dalam mekanik, tetapi juga dalam upaya intelektual. Di negara lain bidang ini telah menjadi agenda khusus dan diperbincangkan dalam suatu konferensi. Sejak tahun 2000, para ahli bahasa dan ahli komputer berkumpul dalam Conference on Intelligent Text Processing and Computational Linguistics. Komputasi linguistik sangat cocok untuk membantu penyusunan kamus. Kamus merupakan sebuah buku referensi yang memuat kosa kata yang terdapat dalam sebuah bahasa, yang disusun secara alfabetis disertai keterangan bagaimana menggunakan kata itu (Keraf 2007). Buku yang dimaksud tak hanya dalam bentuk cetak, pada era teknologi kamus dapat pula disajikan secara elektronik. Analisis komputer terhadap suatu bahasa, dapat dijadikan sebagai korpus elektronik, yaitu koleksi data kebahasaan dari berbagai teks tertulis atau transkripsi rekaman bahasa lisan yang disimpan secara elektronis dalam sebuah database (Kushartanti et al. 2007). Metode dalam penelitian ini sebagai berikut: 1. Digitalisasi, yaitu pemindahan dokumen teks dan suara bahasa daerah ke dalam format digital. 2. Analisis dokumen, yaitu penelaahan secara komputerisasi terhadap dokumen yang telah disimpan dalam format digital. 3. Analisis linguistik, yaitu membuat algoritma khusus dalam bahasa komputer, agar komputer mengenal tata bahasa suatu bahasa daerah. 4. Penyusunan korpus elektroknik, yaitu pengumpulan kata-kata dari hasil analisis linguistik serta dari berbagai dokumen hasil digitalisasi. 5. Penyusunan kamus, yaitu membuat deinisi dari kata-kata yang telah dipilih dengan merujuk pada sumber yang tersedia. III. ANALISIS PENELITIAN 3.1 Leksikograi Bahasa Sunda Tradisi penyusunan kamus bahasa Sunda memang baru berlangsung sekitar satu setengah abad dan hampir semuanya ditulis dan disusun atas prakarsa pribadi. Sekurangkurangnya ada empat macam kamus bahasa Sunda jika dilihat dari sudut bahasa pendampingnya, yaitu Kamus Sunda-Inggris, Kamus Sunda-Belanda, Kamus Sunda-Sunda, dan Kamus Sunda-Indonesia. Sedangkan ditinjau dari segi kronologi penerbitannya, maka A Dictionary of the Sunda Language of Java yang disusun oleh Jonathan Rigg (terbit pertama kali di Batavia tahun 1862), merupakan kamus bahasa Sunda dwibahasa yang tertua, yaitu Sunda-Inggris. S. Coolsma menerbitkan Kamus Sunda-Belanda berjudul Soendaneesch-Hollandsch Woordenboek (1884, 1913, 1930) dan Belanda-Sunda berjudul Hollandsch-Soendaneesch Woordenboek (1910), kemudian Rd. Satjadibrata menerbitkan kamus ekabahasa berjudul Kamus Basa Sunda (1948, 1954, 2005), dan kamus dwibahasa berjudul Kamus Sunda-Indonesia (1952), F.S. Eringa menyusun kamus Sunda-Belanda Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 77 77 8/2/16 11:19 AM berjudul Soendaas-Nederlands Woordenboek (1984), Raden Rabindranat Hardjadibrata menyusun kamus Sunda-Inggris berjudul Sundanese-English Dictionary (2003), dan selama empat puluh tahun R. A. Danadibrata menyusun Kamus Basa Sunda (19301970), dan baru bisa diterbitkan pada tahun 2006. Tampaknya, hingga hari ini hanya ada satu kamus basa Sunda yang disusun oleh sebuah tim atas prakarsa Lembaga Basa jeung Sastra Sunda, yaitu Kamus Umum Basa Sunda (1975, 1980, 1985). Semua kamus bahasa Sunda yang disebutkan di atas merupakan kamus yang sudah ketinggalan zaman, banyak kata-kata baru baik yang berasal dari bahasa asing dalam pelbagai bidang keilmuan yang belum terdokumentasikan, padahal bahasa Sunda merupakan bahasa yang masih akan berkembang pesat sesuai dengan tingkat kemajuan ilmu pengetahuan dan masyarakat pemakai bahasa itu sendiri. 3.2 Komputasi Linguistik Bahasa Sunda Pada tahun 2013, Yayasan Kebudayaan Rancage menetapkan dan mengukuhkan Tim Penyusun Kamus Utama Bahasa Sunda. Ini adalah kamus pertama yang disusun menggunakan metodologi komputasi linguistik. Komputasi linguistik dalam bahasa Sunda, baru dibangun pada tahun 2013 dengan nama Sundaling. Kemampuan dari perangkat lunak ini antara lain: 1. Melakukan analisis terhadap fonologi dalam bahasa Sunda. 2. Steeming bahasa, yaitu otomatisasi pencarian kata dasar. 3. Otomatisasi kata turunan dari sebuah kata dasar, serta kemampuannya untuk membandingkan kata-kata tersebut dengan berbagai dokumen. 4. Media penyimpanan berbagai dokumen kebahasaan dalam bentuk teks, gambar, dan suara. 5. Otomatisasi kalimat, yaitu memecah sebuah halaman teks menjadi beberapa kalimat. 6. Otomatisasi kata, yaitu memecah kalimat menjadi daftar kata-kata. 7. Membuat korpus untuk kamus. 8. Sumber referensi dalam penyusunan kamus. 3.3 Digitalisasi Perkembangan bahasa Sunda dapat diamati dengan adanya penambahan kata-kata yang digunakan oleh masyarakat, baik dalam percakapan lisan maupun tulis. Dengan demikian, penyusunan kamus tak hanya merujuk pada kamus yang terbit sebelumnya, tetap harus dapat merangkum kata-kata baru dari berbagai bidang keilmuan. Kegiatan penelusuran bibliograi bertujuan untuk mendapatkan sumber-sumber terpercaya sebagai rujukan penyusunan kamus, yaitu buku-buku berbahasa Sunda, media berbahasa Sunda, serta rekaman percakapan lisan. Adapun bibliograi yang dimaksud antara lain: 1. Buku-buku bahasa Sunda. Lebih dari 2.000 judul buku bahasa Sunda yang dipindahkan ke dalam format digital sebagai sumber kamus. 78 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 78 8/2/16 11:19 AM 2. Media cetak berbahasa Sunda, mencakup berbagai media yang terbit dalam satu abad terakhir, antara lain Koran Sipatahoenan, Majalah Gondéwa, Majalah Hanjuang, Majalah Manglé, Majalah Cupumanik, Koran Galura, Majalah Sunda Midang, Tabloid Kujang, Koran Sunda, Majalah Seni Budaya, Majalah Suara Daérah, Koran Tribun Jabar (édisi sastra Sunda), Koran Pikiran Rakyat (édisi sastra Sunda), Koran Priangan (édisi sastra Sunda), Majalah Ujung Galuh, Majalah Langlang Budaya, Majalah Bhinneka Karya Winaya, Kalawarta Kudjang, Majalah Salaka, Tabloid Swara Cangkurileung, Koran Giwangkara, Tabloid Mandiri, Majalah Bina Dawah, Majalah Turus, Majalah Cahara Siliwangi, Majalah Iber, dan Majalah Balébat. 3. Data lisan, antarana lain dari cerita pantun yang dibacakan kemudian direkam. Hasil dari penelusuran bibliograi masih berupa naskah dan dokumen dalam hardcopy. Sumber tersebut harus dipindahkan ke dalam format digital untuk memudahkan pengolahan data. Meski didukung oleh perangkat teknologi terkini, proses pemindaian sumber memerlukan waktu yang cukup lama karena harus mengalihkeun ratusan ribu halaman ke dalam format gambar. Adapun perangkat yang digunakan antara lain: 1. Flatbed Scanner, untuk memindahkan naskah buku dan majalah dengan ukuran kertas maksimal A4. 2. Laser Scanner, untuk memindahkan sumber dengan format kertas yang cukup besar, misalnya koran. 3. Kamera digital, untuk memotret dokumen lainnya. Semua hasil pemindaian kemudan dikumpulkan dalam ile format JPG, dan disusun berdasarkan halaman untuk masing-masing sumber. Karena hasil pemindaian masih dalam format gambar, langkah selanjutnya adalah mengindéntikasi teks dalam gambar telah dipindai, menggunakan teknologi Optical Character Recognition (OCR). Aplikasi yang digunakan antara lain ABBYY FineReader versi 11. Teks hasil OCR kemudian dialihkan ke dalam berkas format TXT. Gambar 1. Contoh dokumen dari media massa yang sudah dipindahkan ke dalam database. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 79 79 8/2/16 11:19 AM Gambar 2. Contoh dokumen dalam bentuk buku yang sudah dipindahkan ke dalam database. 3.4 Fonologi Bahasa Sunda Secara umum, komputer tidak mengenal fonem, tetapi hanya mengenali sebuah aksara berdasarkan bentuk (grafem). Saat ini bahasa Sunda menggunakan aksara Latin yang mengandung 7 vokal dan 25 konsonan. Dengan demikian, perlu dibuat sebuah sistem agar komputer mengenal tata suara bahasa Sunda. Tabel 1 menunjukkan susunan huruf yang digunakan dalam bahasa Sunda dan tabel 2 adalah contoh pengunaannya. Vokal /i/, /eu/, /u/, /é/, /e/, /o/, /a/ Konsonan /b/, /c/, /d/, /f/, /g/, /h/, /j/, /k/, /l/, /m/, /n/, /ny/, /ng/, /p/, /q/, /r/, /s/, /t/, /v/, /w/, /x/, /y/, /z/ Tabel 1. Susunan huruf dalam bahasa Sunda Contoh Kata nyeungseung Konsonan /n/, /y/, /e/, /u/, /n/, /g/, /s/, /e/, /u/, /n/, /g/ (11) Pola Grafém KKVVKKKVVKK Pola Foném KVKKVK Susunan Foném /ny/, /eu/, /ng/, /s/, /eu/, /ng/ (6) Lambang Foném ňöŋsöŋ Tabél 2. Contoh penggunaan foném jeung grafem. 80 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 80 8/2/16 11:19 AM 3.5 Aiksasi Komputasi linguistik dapat menyusun algoritma untuk membuat semua kata turunan dari sebuah kata dasar. Bahasa Sunda memiliki kemungkinan lebih dari 200 kata turunan, meski tidak semua kata tersebut digunakan. Dengan mengetik sebuah kata dasar, komputer dapat mengeluarkan semua kata turunan serta menghubungkannya dengan berbagai sumber teks. Gambar 3 merupakan contoh aiksasi sebuah kata dasar disertai frekuensi penggunaannya. Gambar 3. Contoh aiksasi dari kata “adu”. 3.6 Penyusunan Korpus Melalui komputasi linguistik, korpus dapat disusun secara cepat dan otomatis. Komputer dapat memilih dan memilah kata-kata dalam sebuah buku setebal 100 halaman hanya beberapa detik. Sampai saat ini, komputasi linguistik bahasa Sunda telah menyimpan lebih dari 45 juta kata dalam 10 juta kalimat. Adapun kata-kata unik mencapai 450 ribuan. Data ini dapat dijadikan sumber dalam penyusunan kamus dengan mengacu pada frekuensi penggunannnya dalam buku atau dokumen lainnya. Gambar 4. Rekapitulasi jumla kata dan kalimat yang tersimpan dalam komputer. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 81 81 8/2/16 11:19 AM Seperti halnya Google, sebuah kata dapat pula dicari secara manual dengan menelusuri jutaan indeks yang sudah tersimpan dalam database. Gambar 5. Contoh hasil pencarian kata “ngageulis”. 3.7 Koreksi Ejaan Komputasi linguistik bahasa Sunda juga menyediakan fasilitas untuk mengoreksi ejaan dari sebuah sumber teks. Prinsip kerjanya adalah komputer akan membagi teks menjadi daftar kata-kata, kemudian membandingkan dengan korpus dan dokumen digital yang tersedia. Kata yang dianggap keliru atau belum terdapat dalam koleksi korpus, akan ditandai. Gambar 6. Contoh hasil koreksi dari sebuah teks. 82 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 82 8/2/16 11:19 AM 3.8 Penyusunan Kamus Secara umum, langkah-langkah dalam penyusunan kamus bahasa Sunda berbasis komputasi linguistik adalah sebagai berikut: 1. Digitalisasi, yaitu proses pemindahan dokumen teks dan suara ke dalam format digital. Dokumen tersebut berupa buku, majalah, koran, dan rekaman dalam kurun satu abad terakhir. Saat ini, dokumen yang sudah tersimpan lebih dari 2.000 buku dan puluhan ribu halaman media massa. 2. Identiikasi sumber, yaitu proses pencatatan identatis sumber, mencakup tahun penerbitan, judul dokumen, penulis, dan sebagainya. Melalui tahap ini, dapat ditelusuri sejak kapan sebuah kata mulai digunakan. Gambar 7. Alur penyusunan Kamus Utama Bahasa Sunda 3. Pencatatan nama pengarang/penulis, untuk menelusuri siapa saja yang pernah menggunakan sebuah kata, terutama untuk kata-kata yang sudah jarang digunakan. 4. Membentuk tim deinisi, yaitu leksikograf yang akan membantu membuat deinisi lema dan sublema. 5. Pembuatan database kalimat, yaitu menyimpan kalimat dari setiap sumber. Saat ini telah terkumpul lebih dari 10 juta kalimat. 6. Penelusuran entri dan subentri, yaitu otomatisasi korpus kamus berdasarkan sumber-sumber yang tersedia. Pada tahap ini, perangkat lunak akan memecah setiap sumber menjadi daftar kata-kata, disertai dengan informasi dari mana Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 83 83 8/2/16 11:19 AM 7. 8. 9. 10. kata tersebut diperoleh. Perangkat lunak juga akan menandai label setiap kata, misalnya kelas kata, hipenasi, dan sebagainya. Menentukan entri yang perlu disertai dengan gambar, sebagai upaya untuk memudahkan pembaca dalam memahami arti dari sebuah kata. Leksikograf menyusun deinisi berdasarkan entri dan subentri yang telah ditentukan sebelumnya. Untuk memudahkan pembuatan deinisi, perangkat lunak akan menampilkan puluhan contoh kalimat dari entri tersebut, serta rujukan ke kamus-kamus lain termasuk kamus bahasa asing. Tahap validasi, yaitu mengaji ulang setiap entri dan deinisi. Pembuatan tata letak kamus, yaitu otomatisasi hasil deinisi ke dalam format buku sehingga menghasilkan kamus dalam bentuk elektronik yang siap dicetak. Gambar 8 menunjukkan hasil akhir dari kamus yang telah diberi déinisi, siap dicetak, dijadika e-book atau dibuat kamus versi elektronik. Gambar 8. Contoh hasil deinisi. IV. SIMPULAN Melalui komputasi linguistik, penyusunan kamus dapat lebih lengkap, cepat, dan akurat. Hal ini terbukti dalam penyusunan Kamus Utama Bahasa Sunda yang dilakukan kurang dari tiga tahun, dan bisa menghasilkan lebih dari 150.000 entri. Contoh kalimat pada kamus juga akan merujuk pada sumber-sumber yang tersedia, sehingga dapat memperkaya keragaman gaya bahasa. Penyebarannya kamus pun menjadi lebih luas 84 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 84 8/2/16 11:19 AM karena secara otomatis akan tercipta sebuah kamus digital, yang dapat dibuka melalui berbagai perangkat teknologi informasi. Perangkat lunak yang dibuat untuk penyusunan kamus bahasa Sunda, dapat digunakan pula untuk bahasa daerah lainnya, meski tidak setiap bahasa daerah memiliki sumbersumber rujukan yang lengkap. Tetapi setidaknya, ini adalah upaya untuk mengatasi berbagai masalah leksikograi bahasa daerah, melalui metodologi yang lebih canggih dan profesional. Daftar Pustaka Clark, Alexander et al. 2010. The Handbook of Computational Linguistics and Natural Language Processing. Blackwell Publishing. Singapore: 2010. Coolsma, S. 1904. Soendaneesche Spraakkunst. Leiden: A.W. Sijthoff. Coolsma, S. 1910. Hollandsc –Soendaneesch Woordenboek. Leiden: A.W. Sijthoff’s Uitgevers – Maatschappij. Coolsma, S. 1913. Soendaneesch – Hollandsch Woordenboek. Leiden: A.W. Sijthoff’s Uitgevers – Maatschappij. Hardjadibrata, R.R. 2003. Sundanese English Dictionary. Jakarta: Dunia Pustaka Jaya. Kerap, Gorys. 2007. Diksi dan Gaya Bahasa. Jakarta:Gramedia Pustaka Utama. Kushartanti et al. 2007. Pesona Bahasa: Langkah Awal Memahami Linguistik. Jakarta: Gramedia Pustaka Utama. Rigg, Jonathan. 1862. A Dictionary of the Sunda Language of Java. Batavia:Lange & Co. Satjadibrata, R. 2008. Kamus Basa Sunda. Bandung: Kiblat Buku Utama. Sudiroatmadja, M.H. “Morfologi Generatif Komputasi Pembentukan Kata Bahasa Jawa”. dalam PELLBA 7 halaman 213-254. 1993. Sutisna, Dadan. “Komputasi Kamus Sunda”, Cupumanik No. 106, Taun IX, No.10, Mei 2012. Uszkoriet, Hans. 2000. “What Is Computational Linguistics?”. http://www.coli.unisaarland.de/~hansu/what_is_cl.html diakses 6 Mei 2016. Yendra. 2016. Mengenal Ilmu Bahasa (Linguistik). Yogyakarta: Deepublish. Winchester, Simon. 1998. The Professor dan the Madman. Jakarta: Serambi Ilmu Semesta. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 85 85 8/2/16 11:19 AM 86 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 86 8/2/16 11:19 AM Penelitian Korpus Leksikograi: Aplikasi Fonetik Akustik Berkomputer Hajah Norati Bakar Dewan Bahasa dan Pustaka, Brunei Darussalam [email protected] Abstrak Informasi fonetik merupakan antara komponen yang signiikan dalam kajian leksikograi dan dipaparkan dalam struktur mikro kamus (microstructure). Tradisi dan konvensi yang berlaku zaman-berzaman dalam kajian leksikograi mengaplikasikan metode auditori pada deskripsi fonetik terhadap data yang hendak dikumpulkan. Jika metode ini sahaja masih mahu diteruskan, hasil kajiannya sangatlah subjektif dan kebenarannya tidak akan dapat dibuktikan secara objektif. Oleh hal yang demikian, hasil catatan auditori tersebut perlu diuji secara saintiik, dengan menggunakan kaedah fonetik akustik berkomputer. Analisis akustik berkomputer yang dibentangkan dalam kajin ini menggunakan dua perisian komputer, iaitu (i) Sound Filing System (SFS) + WASP for Windows OS dan (ii) Wavesurfer (WS) for Windows OS. Dalam analisis akustik berkomputer, analisis bentuk gelombang bunyi (wave form), pola forman (formant pattern) dalam spektrogram, surihan tekanan bunyi (energy trace), dan surihan gegaran bunyi (noise trace), misalnya, berguna untuk memastikan kehadiran bunyi- bunyi bahasa yang dikaji. Hasilnya sekali gus membolehkan pengkaji menentukan ketepatan sesuatu lambang fonetik IPA sebagai pegangan. Bagi keperluan kajian leksikograi, kertas kerja ini mengemukakan beberapa contoh fonetik (dialek Tutong dan dialek Belait) yang diperoleh hasil eksperimen fonetik akustik berkomputer. Pertama, mendeskripsikan kehadiran bunyi aspirat, bunyi hentian glotis, bunyi pembibiran (labialization), bunyi geluncuran (gliding sound), atau kehadiran penglelangit-kerasan (palatalization) dapat dibuktikan oleh aplikasi WS secara kebalikan. Kedua, memperkenalkan kaedah fonetik akustik berkomputer sebagai salah satu kaedah fonetik eksperimental yang mendedahkan fakta bahasa tanpa terikat kepada teoriteori fonetik yang tertentu. Penelitian semula terhadap kajian-kajian lepas (yang tidak menggunakan kaedah fonetik akustik berkomputer) belum Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 87 87 8/2/16 11:19 AM dikerjakan secara meluas oleh pengkaji- pengkaji generasi baru. Kritikan terhadap kajian-kajian lepas akan ditekankan untuk memahami kelemahan dan kesalahfahaman yang masih berterusan dalam kalangan akademik dan juga untuk membetulkannya untuk kepentingan kita bersama. Kata Kunci: bentuk gelombang bunyi, bunyi aspirat, bunyi hentian glotis, bunyi pembibiran, bunyi penglelangit-kerasan, fonetik akustik berkomputer, pola forman, spektrogram, surihan gegaran bunyi, surihan tekanan bunyi. RESEARCH ON LEXICOGRAPHY: An Application of Computer-aided Acoustical Phonetics Abstract Phonetic information is among the signiicant components in the study of lexicography and indicated in the microstructure of the dictionary. Traditions and conventions employed for ages in the study of lexicography have been applying the auditory method on the description of the data to be collected. If only this method is still insisted, the study results are very subjective and the truth will not be able to be proved objectively. As such, the results of the auditory records need to be tested scientiically, using a method of computer-aided acoustical phonetics. The analyses of phonetic data presented in this research is to use two computer software, namely (i) Sound Filing System (SFS) + WASP for Windows OS and (ii) Wavesurfer (WS) for Windows OS. In the computer-aided acoustical analyses, the analyses of sound waves, formant patterns in the spectrogram, energy trace, and noise trace, for example, are useful to ensure the presence of the sounds of language studied. At the same time, the results allow researchers to determine the accuracy of the IPA phonetic symbols as an authoritative. For the purposes of lexicography study, this paper suggests some phonetic examples (Tutong and Belait dialects) obtained through the experiments of acoustical phonetics. First, to describe the presence of aspirate sound, glottal stop, labialization, gliding sound, or the presence of palatalization that can be proved by the WS in its reverse function. Secondly, to introduce the computer-aided acoustical phonetics as a method of experimental phonetics that reveals the linguistic facts without being bound to a certain phonetic theory. Reviews of previous studies (that did not use a method of computeraided acoustical phonetics) have not been widely carried out by our new 88 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 88 8/2/16 11:19 AM generation of researchers. Criticism of these studies will be emphasized in order to understand the weakness and the misunderstanding that still persist in our academic circle and also to correct them for our mutual beneit. Keywords: aspirate, computer-aided acoustical phonetics, energy trace, formant patterns, glottal stop, labialization, noise trace, palatalization, sound waves, spectrogram. I. PENDAHULUAN Korpus fonetik projek leksikografi dialek-dialek tempatan secara tradisinya bersumberkan kajian lapangan berasaskan kajian auditori. Hasil kajian auditori sangatlah subjektif dan tidak dibuktikan secara objektif. Oleh hal yang demikian, hasil catatan auditori tersebut perlu diuji secara saintiik, dengan menggunakan kaedah fonetik akustik berkomputer. Kajian ini mengaplikasi gabungan perisian komputer, iaitu Sound Filing System (SFS) + WASP for Windows OS dan Wavesurfer (WS) for Windows OS . Aplikasi perisian ini dikesan sangat bermanfaat dalam penelitian korpus fonetik yang autoritatif dalam leksikograi. Secara ringkasnya kedua-dua perisian ini merupakan kajian fonetik akustik, iaitu mengenai transmisi bunyi bahasa melalui udara daripada penutur kepada pendengar yang melibatkan analisis gelombang tuturan dan spektrogram. II. MASALAH KAJIAN Bagi keperluan kajian leksikograi, kertas kerja ini mengemukakan beberapa contoh fonetik (dialek Tutong dan dialek Belait) yang diperoleh hasil eksperimen fonetik akustik berkomputer. Kajian ini memfokuskan penelitian Pertama, mendeskripsikan kehadiran bunyi aspirat, bunyi hentian glotis, bunyi pembibiran (labialization), bunyi geluncuran, atau bunyi penglelangit-kerasan (palatalization) yang dapat dibuktikan oleh aplikasi WS secara kebalikan. Kedua, memperkenalkan kaedah fonetik akustik berkomputer sebagai salah satu kaedah fonetik eksperimental yang mendedahkan fakta bahasa tanpa terikat kepada teori-teori fonetik yang tertentu. III. KAJIAN LEPAS Dalam dialek Tutong dan dialek Belait, persebaran bunyi-bunyi tersebut sering ditampilkan dalam kajian-kajian lepas oleh para pengkaji dialek Tutong dan dialek Belait yang terdiri daripada ahli leksikograi tempatan dan pengkaji individu. Penelitian Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 89 89 8/2/16 11:19 AM bunyi aspirat dan hentian glotis dalam dialek Tutong dan dialek Belait sangat penting kerana kedua-dua bunyi tersebut merupakan pasangan minimal dalam sepasang kata yang tertentu dan dikesan sebagai unsur yang mempunyi sifat distingtif. Antara kajian lepas yang mendeskripsikan fonetik bahasa-bahasa daerah di negara ini ialah dialek Tutong ialah Kamus Melayu–Tutong - Tutong–Melayu (DBP, 1991), Struktur Bahasa Tutong (Ramlee Tunggal, 2005) dan Struktur Bahasa Belait (Noor Alifah, 2004). Kajian-kajian lepas ini menampilkan aspek fonetik dialek Tutong dan dialek Belait berasaskan kajian auditori. Dapatan pengkaji ini masih bersifat subjektif dan perlu dikaji secara saintiik. IV. METODOLOGI KAJIAN Seperti yang dinyatakan di atas bahawa analisis akustik berkomputer ini akan mendedahkan kesahihan fonetik sesuatu kata. Sound Filing System (SFS) + WASP for Windows OS menghuraikan bunyi bahasa yang dikaji dalam bentuk: 1. Gelombang bunyi (wave form); 2. Spektrogram dengan pola forman (formant pattern); 3. Surihan tekanan bunyi (energy trace); dan 4. Surihan gegaran bunyi (noice trace). Seterusnya Wavesurfer (WS) for Windows OS pula bermanfaat menghuraikan bunyi ujaran dalam bentuk gelombang bunyi. Dalam kajian ini aplikasi WS akan memanfaatkan kaedah kebalikan (reverse) untuk memastikan kehadiran bunyi-bunyi bahasa yang dikaji secara saintiik, seperti gambaran dan keterangan yang berikut: Gambar 1. Contoh Hasil Kajian Fonetik Akustik Berkomputer 90 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 90 8/2/16 11:19 AM Gambar 2. Pergerakan Belakang Lidah dan Depan Lidah Gambar 1 menjelaskan contoh visual hasil kajian fonetik akustik, seperti yang berikut: Pertama, Gelombang bunyi (bunyi ujaran) dicirikan oleh pola bentuk (waveform) berfungsi memperlihatkan perubahan pita suara yang disebabkan oleh arus udara yang keluar masuk dari atau ke paru-paru; Sementara Spektrogram (spectrogram) dan forman (F) (lihat spektrogram Gambar 2.1) menggambarkan gema, dengan kata lain forman berfungsi menggambarkan pergerakan lidah, iaitu jalur forman (F) yang menerima tekenan bunyi yang kuat akan ditampilkan dengan warna pekat. Dalam hal ini F1 menggambarkan gema di belakang lidah (rongga farinks), sementara F2 pula menggambarkan gema di depan lidah (rongga mulut) (lihat Gambar 4.2). Yang demikian hasil analisis spektrogram menjelaskan bahawa pergerakan lidah dan perubahan bentuknya mempengaruhi nilai forman (F1) dan (F2). Kedua, Surihan tekanan bunyi (energy trace) menggambarkan turun naik tekanan bunyi suatu ujaran. Bunyi aspirasi dalam ujaran natural memperlihatkan penurunan tekanan bunyi dalam masa yang singkat. Ketiga, Surihan gegaran bunyi (noise trace) menggambarkan pola sifat vokal dan konsonan. Konsonan biasanya dicirikan oleh pola frekuensi yang tidak berkala (aperiodic), tetapi vokal pula dicirikan oleh pola frekuensi yang agak tetap yang berkala (periodic). Manakala konsonan nasal memperlihatkan ciri vokal dari segi gelombang bunyi. Keempat, Surihan penyuaraan bunyi (voicing trace) berfungsi untuk mengesan perbezaan penyuaraan bunyi. Hasil kajian dapat menggambarkan turun naik kadar Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 91 91 8/2/16 11:19 AM getaran pita suara, makin tinggi kadar getaran suara, makin naik surihan penyuaraan bunyi. Dengan yang demikian surihan penyuaraan rendah menjelaskan bunyi takbersuara, manakala surihan penyuaraan tinggi membuktikan bunyi bersuara.1 V. OBJEKTIF KAJIAN Objektif kajian ini terbahagi kepada dua, iaitu: i. Meneliti korpus leksikograi (bertujuan menghasilkan fonetik yang autoritatif) dengan mengapalikasi fonetik akustik berkomputer dengan meneliti beberapa contoh dialek Tutong dan dialek Belait sebagai eksperimen; ii. Memperkenalkan kaedah fonetik akustik berkomputer, khususnya kepada ahli leksikograi,sebagai salah satu kaedah fonetik eksperimental yang mendedahkan fakta bahasa tanpa terikat kepada teori-teori fonetik yang tertentu. VI. DAPATAN KAJIAN Yang berikut ialah hasil kajian fonetik auditori dan analisis fonetik akustik: 6.1 Kajian Fonetik Auditori Seperti yang dinyatakan bahawa tradisi penjanaan korpus fonetik leksikograi dilakukan melalui kajian fonetik auditori. Antara contohnya dipaparkan sebagai yang berikut: Bil. 1 92 Kata Sebutan Makna Kata Sebutan 1 pati [pat?] patah pati [patiʰ] 2 jelu [ʤәluˀ] semat jelu [ʤәluʰ] 3 4 5 puti tuju bulu [putiˀ] [tuʤuˀ] [buluˀ] putih tujuh bulu puti tuju bulu [putiʰ] [tuʤuʰ] [buluʰ] 6 bua [buaˀ] buah bua [buaʰ] Makna kematian sejenis ikan yu pisang tuju; hala buluh buah (penjodoh bilangan) Keterangan yang lebih terperinci (lihat Sato dalam Jurnal Bahasa Januari–April 2011). Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 92 8/2/16 11:19 AM 7 mulo [muloˀ] kiasan 1. gatal tangan 2. gatal mulut 8 tayi [tajiˀ] tahi tayi [tajiʰ] 9 kali [kaliˀ] mungkin kali [kaliʰ] 10 ilu [iluˀ] ilu [iluʰ] kuku 11 ala [alaˀ] ala [alaʰ] kalah lampu (pelita) hasil mulo [muloʰ] menanam (sesuatu benih dan lain-lain) hilang;l enyap kali (darap) Jadual 1. Dapatan Kajian Lapangan Auditori Hasil kajian lapangan (kajian fonetik auditori) di atas mendedahkan kewujudan bunyi hentian glotis [ˀ] dan aspirat [ʰ] seperti contoh-contoh yang dipaparkan dalam Jadual 6.1, yang berjalur biru merupakan leksikal-leksikal yang menggambarkan bunyi-bunyi hentian glotis[ˀ]. Yang berjalur hijau pula ialah hasil lapangan auditori yang menggambarkan bunyi aspirat [ʰ]: 1) a. Pati [pati ˀ] bermaksud Ãpatah΄ dalam ayat: [pooʰ niʰ patiˀ ](kakinya patah) b. pati [patiʰ ] bermaksud ‘kematian’ Contoh ayat : [kudoʰ patiʰ niʰ ] (bilahkah dia meninggal dunia ?) 2) a. Jelu [ʤәluˀ ] bermaksud ‘semat’ Contoh ayat : [ ʤәluˀ butang baʤuˀ anaʔ inaˀ ] (sematkan butang baju budak itu) b. Jelu [ʤәʰ] bermaksud sejenis ikan laut, berbadan panjang, seperti ular berukuran 2– 3 kaki, tidak bersisik, dan kepalanya pipih. Contoh ayat: [ndoʰ ʤiˀ sajiˀ kәgitan putaˀ jәluʰ] (saya tidak pernahmelihat ikan jelu). 3) a. puti [putiˀ] bermaksud warna ‘putih’ Contoh ayat: [kәnaiʰ niʰ kәtabiˀ putiˀ](adiknya semua putih] b. puti [putiʰ] bermaksud ‘pisang’ Contoh ayat: [Mijan buaˀ putiʰ] (makan buah pisang) 4) a. tuju [tuʤuˀ ] bermaksud tujuh (7) Contoh ayat [tujuˀ tuliˀ buaˀ putiʰ] (tujuh biji buah pisang) b. tuju bermaksud pergi [dәmboʰ dai tuʤuʰ juˀ kәnalom niʰ](kemanakah awak pergi semalam?) Contoh leksikal di atas memperlihatkan adanya kelainan makna setiap kata berdasarkan sebutan dan konteks yang diutarakan. Dengan yang demikian kehadiran hentian glotis dan aspirat setiap kata perlu ditampilkan dengan fonetik yang betul. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 93 93 8/2/16 11:19 AM Menurut Nortofer bahawa bahasa Tutong ada konsonan geseran yang lemah sekali, iaitu [ʰ] dan [ˀ] yang tidak ditulis dalam ejaan, misalnya [buɲaʰ] dan [tanaˀ](DBP, 1991). Sehubungan dengan kajian-kajian lepas, hasil kajian fonetik akustik berkomputer yang dikemukakan ini merupakan kajian awal. Contoh yang dibentangkan dalam kertas kerja ini hanya sebagai perintis kepada ahli leksikograi tempatan. Namun, kajian ini membuktikan bahawa kesahihan korpus fonetik untuk tujuan leksikograi dapat dimantapkan dengan memanfaatkan eksperimen fonetik akustik bagi mendeskripsikan fonologi bahasa yang belum mantap sistem ejaan dan sebutannya, misalnya dialek Tutong dan dialek Belait. 6.2 Analisis Fonetik Akustik Bunyi Hentian Glotis Rajah yang berikut merupakan antara hasil eksperimen yang menggambarkan hasil kajian fonetik akustik, iaitu bunyi hentian glotis yang hadir di akhir kata dalam dialek Tutong: Gambar 6.2.1. Hasil Kajian Fonetik Akustik Bunyi Hentian Glotis [ʤәluˀ] 94 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 94 8/2/16 11:19 AM Gambar 6.2.2. Hasil Kajian Fonetik Akustik Bunyi Hentian Glotis [iluˀ] Gambar 6.2.3. Hasil Kajian Fonetik Akustik Bunyi Hentian Glotis [muloˀ] Gambar analisis akustik di atas merekodkan hasil penelitian perkataan “jelu”, “ilu” dan “mulo”. Hasil penelitian gelombang bunyi yang dicirikan oleh pola bentuk (waveform) memperlihatkan perubahan tekanan arus udara amplitud tidak tersekat dengan sempurna yang menandakan celah glotis masih terbuka sedikit (tidak disekat dengan sempurna). Ini membuktikan kehadiran hentian glotis [ˀ] di akhir ketiga-tiga perkataan, iaitu [ʤәluˀ] (lihat Gambar 6.2.1),[iluˀ] (lihat Gambar 6.2.2) dan [muloˀ] (lihat Gambar 6.2.3). Seterusnya gambar di atas merekodkan hasil analisis spektrogram (spectrogram). Hasilnya jalur F1 dan F2 menggambarkan gema bertekenan tinggi, namun kepekatan Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 95 95 8/2/16 11:19 AM jalur F1 dan F2 kelihatan berkurangan dibandingkan dengan jalur F1 dan F2 pada bunyi sebelumnya yang juga menerima tekanan tinggi, iaitu bunyi vokal [u] [ʤәluˀ] (lihat Gambar 6.2.1) dan [u] [iluˀ] (lihat Gambar 6.2.2) dan [o][muloˀ] (lihat Gambar 6.2.3). Hasil penelitian surihan gegaran gelombang bunyi (noise trace) kata “jelu”, “ilu” dan “mulo” di atas merekodkan sifat tak berkala (aperiodic). Surihan gegaran bunyi di akhir kata (selepas vokal [u]) ketiga-tiga kata yang dikaji direkodkan semakin menaik. Hal ini mencirikan frekuensi konsonan hadir di akhir kata (selepas vokal [u]). Dengan yang demikian, membuktikan kehadiran hentian glotis [ˀ] di akhir kata ketiga-tiga kata tersebut, iaitu [ʤәluˀ] (lihat Gambar 6.2.1), [iluˀ] (lihat Gambar 6.2.2) dan [muloɂ] (lihat Gambar 6.2.3). Terakhir hasil SFS memperlihatkan analisis surihan penyuaraan bunyi (voicing trace) “jelu”, “ilu” dan “mulo” menggambarkan surihan penyuaraan kadar getaran suara kelihatan mula menurun atau rendah. Menurut jadual konsonan IPA bahawa bunyi hentian glotis [ˀ] merupakan bunyi tak bersuara. Dengan yang demikian hasil surihan penyuaraan pada akhir ketiga-tiga kata “jelu”, “ilu”, dan “mulo” yang semakin rendah ini jelas membuktikan kewujudan hentian glotis [ˀ], iaitu [ʤәluˀ] (lihat Gambar 6.2.1),[iluˀ] (lihat Gambar 6.2.3) dan [muloˀ] (lihat Gambar 6.2.4). 6.3 Analisis Akustik Bunyi Aspirat [ʰ] Rajah yang berikut merupakan antara hasil yang menggambarkan hasil kajian akustik, iaitu persebaran bunyi aspirat dalam dialek Tutong: [ ʤәluʰ ], [ iluʰ ], dan [muloʰ]: Gambar 6.3.1. Hasil Kajian Fonetik Akustik Bunyi Aspirat[ʤәluʰ] 96 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 96 8/2/16 11:19 AM Gambar 6.3.3. Hasil Kajian Fonetik Akustik Bunyi Aspirat [mulͻʰ] Hasil penelitian gelombang bunyi fonologi pekataan “jelu”, “ilu” dan “mulo” dicirikan oleh pola bentuk (waveform) memperlihatkan perubahan tekanan arus udara amplitud tidak tersekat yang menandakan celah glotis terbuka. Ini membuktikan kehadiran konsonan. Pola bentuk ini sekali gus membuktikan kehadiran bunyi aspirat [ʰ] di akhir perkataan [ʤәluʰ], [iluʰ] dan [muloʰ]. Seterusnya analisis spektrogram (spectrogram) menggambarkan gema, iaitu jalur forman (F) dikesan menerima tekanan bunyi yang lemah. Ini dibuktikan oleh corak F1 dan F2 berwarna cair, iaitu menggambarkan ciri aspirat [ʰ]. Manakala hasil penelitian surihan gegaran gelombang bunyi (noise trace) kata “jelu”, “ilu” dan “mulo” di atas bersifat tak berkala (aperiodic) yang mencirikan frekuensi konsonan di akhir kata. Hasil penelitian ini juga membuktikan kehadiran aspirat [ʰ], iaitu [ʤәluʰ] (lihat Gambar 6.3.1),[iluʰ] (lihat Gambar 6.3.2) dan [muloʰ] (lihat Gambar 6.3.3). Terakhir hasil analisis surihan penyuaraan bunyi (voicing trace) perkataan “jelu”, “ilu” dan “mulo” menggambarkan surihan penyuaraan bunyi semakin rendah atau menurun sehingga lenyap. Sebagaimana yang dinyatakan bahawa surihan penyuaraan bunyi yang rendah menggambarkan bunyi tak-bersuara. Hal ini membuktikan bahawa akhir kata [ʤәluh] (lihat Gambar 6.3.1),[iluh] (lihat Gambar 6.3.2) dan [muloh] (lihat Gambar 6.3.3) merekodkan kehadiran aspirat. Menurut IPA bahawa bunyi [h] merupakan bunyi konsonan tak bersuara. 6.4 Hasil Analisis Aplikasi Wavesurfer (WS) for Windows OS Seperti yang dinyatakan sebelumnya bahasa analisil waversurfer atau (WS) dapat membuktikan kesahihan fonetik dengan cara menterbalikkan pola bentuk gelombang bunyi asal kata yang dikaji (sama ada kebalikan keseluruhan pola gelombang atau Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 97 97 8/2/16 11:19 AM sebahagian yang relevan daripadanya). Antara contoh analisis adalah seperti penjelasan yang berikut: 6.4.1. Analisis WS Bunyi Hentian Glotis Gambar 6.4.1.1 Sebutan Asal Jelu (semat) [ʤәluɂ] Gambar 6.4.1.2. Bunyi Hentian Glotis [ɂ] 98 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 98 8/2/16 11:19 AM Gambar 6.4.1.3. Bunyi kebalikan [ʤәluɂ]-> [ɂulәʤ] Gambar 6.4.1.4. bunyi kebalikan [luɂ] suku kata akhir Gambar 6.4.1.1 merekodkan bunyi sebutan asal perkataan “jelu”. Hasil analisis pola gelombang akhir suku kata, pola gelombang menggambarkan arus udara tersekat namun tidak sempurna. Sementara Gambar 6.4.1.2 merekodkan kehadiran hentian glotis [ɂ] yang tidak sempurna kerana pola gelombang menandakan arus udara tidak tersekat dengan sempurna. Apabila bunyi kata ini diterbalikkan (reverse) secara keseluruhannya, bunyi kebalikan kata “jelu” melahirkan bunyi [ɂulәʤ].Gambar 6.4.1.3 bunyi kebalikan merekodkan kata ini dimulai dengan kehadiran hentian glotis. Apabila suku kata akhir ([luɂ]) diterbalikkan, sekali lagi dapatan merekodkan kehadiran hentian glotis yang tidak sempurna. (lihat Gambar 6.4.1.4) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 99 99 8/2/16 11:19 AM 6.4.2 Analisis WS Bunyi Aspirat [ʰ] Yang berikut merupakan hasil eksprimen aplikasi WS bagi fonetik aspirat [ʰ]: Gambar 6.4.2.1. Sebutan Asal Kata Jelu (sj ikan laut) [ʤәluʰ] Gambar 6.4.2.2. Kebalikan Kata Jelu[ʤәluʰ] 100 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 100 8/2/16 11:19 AM Gambar 6.4.2.3. Kebalikan Bunyi [u] Pada Suku Kata Akhir Gambar 6.4.2.1 merekodkan sebutan asal perkataan yang menggambarkan kehadiran aspirat ([ʤәluʰ]). Sementara Gambar 6.4.2.2 merupakan hasil analisis kebalikan kata “jelu” secara keseluruhannya. Hasil analisis kebalikan ini merekodkan kata “jelu” sebagai [ʰulәʤ], iaitu menunjukkan hadirnya bunyi aspirat yang lemah. Begitu juga apabila bunyi [u] pada suku kata akhir diterbalikkan, sekali lagi bunyi aspirat [ʰ] kedengaran dan melahirkan bunyi [ʰu]. Dengan yang demikian kaedah WS ini dapat memantapkan lagi analisis fonetik akustik dengan mendeskripsikan bunyi-bunyi ujaran secara terbalik. 6.4.3 Analisis WS Bunyi Geluncurn (gliding sound) atau Penglelangit-Kerasan (Palatalization) Gambar 6.4.3.1 Gambar Penuh Bunyi Buek [buɛɁ] Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 101 101 8/2/16 11:19 AM Gambar 6.4.3.2. Bunyi Asal Bahagian [j] Gambar: 6.4.3.3. Setelah Didekod Terbalik 102 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 102 8/2/16 11:19 AM Gambar: 6.4.3.1 merupakan contoh hasil analisis sama ada hadirnya bunyi penglelangit- kerasan (palatalization) atau cuma bunyi geluncuran dalam kata (buek), yang bermakna bunga dalam bahasa Belait. Hasil analisis fonetik auditori kedengaran bunyi [j] di antara bunyi [u] dengan [ɛ] kata tersebut. Seterusnya hasil analisis fonetik akustik merekodkan kehadiran bunyi [j] (lihat Gambar 6.4.3.2). Untuk pembuktian kehadiran bunyi [j], bahagian yang sama didekod secara terbalik. Hasilnya merekodkan bunyi geluncuran [j] kekal seperti hasil fonetik auditori (lihat gambar 6.4.3.3). Dengan yang demikan, fakta ini mengesahkan kehadiran bunyi geluncuran [j]). Hal ini dibandingkan dengan hasil analisis bunyi geluncuran pada kata (biek), seperti keterangan yang berikut: Gambar 6.4.3.4. Gambar Asal Kata [biɛɁ] Gambar 6.4.3.5. Hasil Bunyi Didekod Bunyi [iɛ Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 103 103 8/2/16 11:19 AM Gambar 6.4.3.6. Hasil Didekod Kebalikan Membuktikan [ɛi] Bukan [j] Gambar 6.4.3.4 memperilhatkan kata (biek) yang bermakna basah dalam dialek belait. Berdasarkan analisis fonetik auditori kedengaran bunyi [j] yang sama seperti dapatan pada kata buyek [bujɛɁ]. Namun setelah dianalisis secara fonetik akustik (WS) ternyata hanya hadir buyi peralihan [i], [iɛ], [ɛ] yang tidak dapat dipisahkan (lihat Gambar 6.4.3.5). Untuk kepastian lebih lanjut, bunyi ini didekodkan secara terbalik menggunakan aplikasi WS. Dapatan metode ini merekodkan bunyi [ɛi] bukan [j]. 6.4.4 Analisis WS Bbunyi Pembibiran (labialization) Gambar 6.4.4.1. Kata Muang 104 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 104 8/2/16 11:19 AM Gambar 6.4.4.2. [w] dalam Kata Muang Gambar 6.4.4.3. Bunyi Didekod Kebalikan Bunyi yang dikaji seterusnya ialah bunyi kata (muang) yang bermaksud luar (lihat Gambar 6.4.4.1 Kata Muang). Berdasarkan kajian fonetik auditori bahagian kata ini juga kedengaran bunyi [w]. Apabila dianalisis menggunakan WS, hasilnya merekodkan bunyi [w]. (lihat Gambar 6.4.4.2). Seterusnya bunyi di bahagian ini didekodkan secara terbalik, hasilnya merekodkan bunyi [awum], seperti paparan Gambar: 6.4.4.3). VII. KESIMPULAN Makalah ini meneliti korpus leksikograi aplikasi fonetik akustik berkomputer. Melalui eksperimen terhadap contoh-contoh korpus leksikograi, kajian ini berhasil mendeskripsikan fonetik kehadiran bunyi aspirat, bunyi hentian glotis menggunakan SFS. Manakala bunyi penglelangit-kerasan (palatalization) dan bunyi pembibiran (labialization) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 105 105 8/2/16 11:19 AM merupakan antara contoh yang dapat dibuktikan oleh aplikasi WS secara kebalikan. Melalui penelitian rintis ini dikesan metodologi kajian fonetik akustik berkomputer sangat bermanfaat dalam penelitian korpus leksikograi. Metode ini juga dikesan meningkatkan ketelitian deskripsi fonetik yang dibuat secara fonetik auditori. Dengan yang demikian kaedah baru ini bukan sahaja membetulkan kesalahafaman pengkaji secara berterusan, malah dengan metodologi ini dapat meningkatkan jumlah korpus leksikograi, sekali gus korpus fonologi dan fonetik leksikograi dapat disahihkan secara objektif. Daftar Pustaka International Phonetic Association, 1999. Handbook of International Phonetic Association: AGuide to the use of the International Phonetic Alphbet. Cambridge University Press. Nothofer 1991. “Panduan Kepada Pengguna” dlm Kamus Tutong–Melayu Melayu–Tutong Ramlee Tunggal, 2005. Struktur Bahasa Tutong. Dewan Bahasa dan Pustaka Brunei Sato, Hirobumi @ Rahmat, 2011. “Analisis Akustik Konsonan/-h/ Dalam Kata Terbitan Berimbuhan {-an} /-an/” dlm Jurnal Bahasa Januari-April, hlm.110-126. Dewan Bahasa dan Pustaka Brunei Rujukan Internet: www.speech.kth.se/wavesurfer download.php 106 www.phon.ucl.ac.uk/resource/sfs/ Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 106 8/2/16 11:19 AM Perancangan Aplikasi Kamus Mobile Bahasa Madura sebagai Upaya Pelestarian Bahasa Daerah Salim Anshori & Iqbal Nurul Azhar Prodi Sastra Inggris, Universitas Trunojoyo Madura [email protected] [email protected] Abstrak Saat ini, upaya pengembangan bahasa daerah (Madura) mengalami banyak kendala. Salah satunya adalah masalah ketertarikan generasi muda dalam menggunakan dan melestarikan bahasa Madura. Bahkan, ada anggapan dari sebagian generasi muda, bahwa bahasa Madura itu sudah kuno, penggunanya ketinggalan jaman dan akhirnya penggunaan bahasa Madura cenderung menjadi bahan olok-olokan. Akibatnya, generasi muda yang seharusnya menjadi pewaris bahasa Madura justru semakin enggan untuk menggunakan bahasa Madura dalam kegiatan sehari-hari. Untuk menjawab tantangan ini, maka kami memanfaatkan platform teknologi “mobile” berbasis Android (salah satu teknologi yang popular dikalangan generasi muda saat ini) untuk merancang kamus bahasa Madura. Metode yang diterapkan adalah Hashmap (metode yang digunakan untuk memudahkan pencarian data/kata). Tujuan penelitian ini adalah untuk merancang aplikasi kamus mobile bahasa Madura. Dari sini diharapkan, bahasa Madura semakin dekat dengan generasi muda penutur aslinya sehingga bahasa Madura bisa semakin lestari, adanya anggapan bahwa bahasa Madura itu kuno, tertinggal jaman akan terbantahkan, dan untuk memudahkan penutur bahasa lain dalam mempelajari bahasa Madura. Key words: bahasa Madura, kamus android, pelesatarian bahasa daerah Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 107 107 8/2/16 11:19 AM I. PENDAHULUAN 1.1 Latar Belakang Kondisi bahasa daerah di Indonesia dewasa ini semakin mengkhawatirkan. Sudah banyak penelitian dilakukan untuk merevitalisasi bahasa daerah. Pun banyak yang menemukan fakta bahwa keberadaan bahasa daerah di Indonesia semakin terpuruk (Santoso, Budiwiyanto, Azhar. 2008, Darwis. 2011). Penyebab semakin terpinggirkannya bahasa daerah di Indonesia ini bermacam-macam. Namun dari berbagai penelitian, hampir semuanya menyebutkan bahwa salah satu faktor utama terpinggirkannya bahasa daerah pada saat ini adalah karena adanya gempuran atau tantangan globalisasi yang luar biasa. Tantangan globalisasi ini utamanya terkait dengan generasi muda kita. Hal ini sangat penting untuk diperhatikan, karena mau tidak mau, generasi muda kita inilah yang akan menjadi pewaris bahasa – bahasa daerah tersebut. Tanpa mereka, bahasa – bahasa daerah manapun akan punah dengan sendirinya. Budiyanto, misalnya, menyebutkan bahwa para ahli bahasa meyakini akan ada sekitar setengah dari bahasa – bahasa di dunia yang akan punah. Sedangkan khusus di Indonesia, Moseley (2010) menyebutkan bahwa ada 146 bahasa yang terancam punah dan 12 bahasa yang telah punah. Bahasa-bahasa daerah itu umumnya berada di Indonesia bagian timur. Bahasa-bahasa daerah yang teridentiikasi telah punah misalnya adalah bahasa Hukumina, Kayeli, Liliali, Moksela, Naka’ela, Nila, Palumata, Piru, dan Te’un di Maluku, Mapia dan Tandia di Papua, serta Tobada’ di Sulawesi. Banyak dari bahasabahasa daerah yang punah itu disebabkan karena jumlah penuturnya yang sudah habis atau tinggal sedikit. Namun pada kenyataannya, bahkan bahasa- bahasa daerah yang penuturnya masih sangat banyak (jutaan bahkan puluhan juta penutur) sekalipun, saat ini juga bisa terancam punah karena arus globalisasi. Misalnya adalah bahasa Madura. Sekalipun bahasa Madura masih mempunyai penutur bahasa yang sangat banyak, bahkan puluhan juta penutur1, namun tantangan dan upaya untuk menyelamatkan bahasa ini dari kepunahan juga tidak mudah. Azhar (2008) mencermati bahwa generasi muda Madura saat ini semakin tidak ‘akrab’ untuk menggunakan bahasa daerahnya untuk berkomunikasi dalam konteks bahasa tulis, baik dalam bentuk surat maupun SMS. Terlepas dari adanya beberapa hambatan secara internal bahasa, adanya tren globalisasi 1 Data dari Biro Pusat Statistik yang diungkapkan oleh Kepala balai Bahasa Propinsi Jawa Timur, Drs. Amir Mahmud, M. Pd. dalam wawancaranya dengan reporter Lontar Madura (El Iemawati) menunjukkan bahwa jumlah penutur bahasa Madura ada jutaan, walaupun ada kecenderungan selalu menurun dari waktu ke waktu. (Pada tahun 1980 jumlah penutur bahasa Madura berjumlah 6.913.977 orang, pada tahun 1990 berjumlah 6.792.447 penutur). Sedangkan Situs www.ethnologue.com menyebutkan, berdasar sensus tahun 2000, penutur bahasa Madura ada 6.770.000 penutur. Walaupun dalam situs tersebut status bahasa Madura adalah “berkembang” namun jelas pada kenyataanya, jumlah penuturnya semakin berkurang walaupun secara total, jumlahnya masih jutaan. 108 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 108 8/2/16 11:19 AM yang ditunjukkan dengan perkembangan teknologi, tidak bisa diabaikan perannya dalam permasalahan ini. Adanya perkembangan teknologi dan penggunannya oleh generasi muda ternyata ikut mempengaruhi pola pikir mereka. Yang paling utama, perubahan terhadap sikap generasi muda pada bahasa- bahasa daerahnya. Hal senada juga disampaikan oleh Darwis (2011) bahwa ternyata tidak semua generasi muda kita masih memperoleh dan mempelajari bahasa daerahnya masingmasing. Kejadian ini terjadi tidak hanya di daerah perkotaan saja, namun juga terjadi di daerah pedesaan. Artinya, bahasa- bahasa daerah sudah (dan masih terus berlanjut) terdesak perkembangannya. Dalam kasus bahasa Makasar dan bahasa Bugis (yang menjadi kajiannya Darwis, 2011) disebutkan paling tidak ada 3 faktor yang meyebabkan bahasa daerah tersebut tergeser dari posisinya sebagai bahasa pertama untuk generasi muda di daerah perkotaan. Yang pertama adalah lingkungan pergaulan yang majemuk bahasa (suku). Kedua, medan tugas yang relatif tidak tetap. Ketiga, orang tua berlainan suku. Sedangkan untuk daerah pedesaan, faktor utama yang berpengaruh adalah faktor kehadiran lembaga pendidikan Taman Kanak-Kanak (TK) di pedesaan. Di sekolah TK ini biasanya guru-guru menggunakan bahasa Indonesia sebagai bahasa pengantarnya, akibatnya, orang tua anak-anak juga ikut terpengaruh. Mereka mempersiapkan anakanaknya untuk menguasai bahasa Indonesia (bukan bahasa daerahnya) agar tidak tertinggal dalam pelajaran di sekolahnya. Setali tiga uang, hal serupa juga terjadi di Propinsi Aceh. Tim pemetaan bahasa Balai Bahasa Banda Aceh melaporkan bahasa Devayan yang merupakan bahasa daerah di Kepulauan Banyak, mulai diindikasikan akan punah. Lebih lanjut, dikhawatirkan hal serupa juga akan terjadi pada bahasa daerah lainnya, misalnya bahasa Aceh dan Gayo. Sekalipun saat ini bahasa Aceh masih digunakan hampir setiap wilayah di Provinsi Aceh. Sebagai catatan tambahan, bahasa Aceh merupakan bahasa daerah dengan jumlah penutur terbanyak di propinsi ini, dan disusul oleh bahasa Gayo (Santoso. TT). Masih menurut Santoso, kasus bahasa daerah di Aceh juga menarik untuk dikaji. Menurutnya, ada hal yang ironis terjadi di Aceh, dimana banyak orang-orang yang menyadari pentingnya melestarikan bahasa daerah, namun pada kenyataannya, dia sendiri sering menggunakan istilah-istilah asing yang notabene sudah ada padanannya dalam bahasa daerah (dan Indonesia). Lebih khusus, Santoso menyoroti generasi muda Aceh yang mulai meninggalkan bahasa daerahnya. Mereka cenderung menggunakan bahasa gaul. Fenomena ini lebih marak dijumpai didaerah perkotaan. Hal ini bisa dipahami karena generasi muda ini masih labil dan mudah terpengaruh. Mereka sedang dalam masa pencarian jati dirinya. Namun menurut Santoso (TT), seharusnya akan lebih baik jika mereka lebih dulu menguasai dan mengutamakan bahasa daerahnya sendiri sebagai pondasinya. Namun yang terjadi saat ini adalah sikap berbahasa penutur bahasa Aceh, utamanya generasi mudanya, yang cenderung negatif. Mereka lebih suka menggunakan istilah-istilah asing agar terlihat lebih modern dan intelek. Padahal sebenarnya mereka juga belum tentu Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 109 109 8/2/16 11:19 AM benar-benar paham dengan istilah-istilah asing yang mereka gunakan tersebut. Bukan hanya generasi mudanya, namun juga penggunaan papan-papan nama di pinggir jalan, mereka lebih suka menggunakan istilah asing. Inilah yang disebut oleh Santoso (TT) sebagai fenomena budaya nginggris yang diyakini tidak hanya terjadi di Aceh, tapi juga diberbagai daerah Indonesia lainnya. Tekanan terhadap bahasa daerah juga datang dari para penguasa pembuat kebijakan yang belum benar-benar berpihak kepada kelestarian bahasa Daerah. Sebutlah apa yang terjadi di Provinsi Aceh. Santoso merasakan adanya diskriminasi perlakuan pemerintah terhadap bahasa daerah. Perlakuan itu salah satunya mengakibatkan tertundanya kegiatan Kongres Bahasa Aceh yang sebelumnya (akan) rutin diagendakan. Memang, saa ini telah ada produk hukum berupa Undang-Undang No.24 Tahun 2009 tentang Bendera, Bahasa, Lambang Negara, dan Lagu Kebangsaan. Khusus tentang bahasa, di dalam undang-undang tersebut telah diatur bagaimana kedudukan dan fungsi bahasa daerah, bahasa Indonesia, dan bahasa asing. Namun seiring dengan adanya kebijakan otonomi daerah, implementasi dari Undang-Undang ini menjadi tumpang tindih dan menjadi kabur. Utamanya untuk bahasa daerah, ternyata tidak semua daerah benar-benar memahami pentingnya kelestarian bahasa daerahnya masing-masing, seperti halnya yang terjadi di Aceh. Pada akhirnya, Santoso berharap, sekalipun kita menjadi bagian pemain di dalam modernitas itu, tetapi tetap kukuh dengan nilai-nilai kedaerahan (aceh). Dengan demikian, identitas kedaerahan (aceh) itu tetap dapat dipertahankan. Dari uraian diatas, cukup jelas terasa betapa beratnya tantangan bahasa daerah untuk tetap bertahan di era globalisasi ini. Mulai dari hambatan internal, yakni adanya perbedaan sistem tata bunyi, perbendaharaan kata dan sisten tata kalimatnya dengan bahasa lain, sampai dengan hambatan eksternalnya. Hambatan eksternal ini cukup kompleks dan melibatkan banyak unsur. Baik masyarakat penuturnya (utamanya generasi muda) yang bersikap negatif terhadap bahasa daerahnya, tekanan dari bahasa lainnya (bahasa Indonesia dan bahasa Inggris) sampai dengan minimnya dukungan dari pembuat kebijakan. Makalah ini tidak hendak menyelesaikan semua permasalahan diatas. Namun penulis melihat ada benang merah antara permasalahan keengganan generasi muda menggunakan bahasa daerahnya dengan tren globalisasi. Di uraian diatas disinggung bahwa banyak ahli bahasa yang beranggapan bahwa globalisasi dan modernisasi dengan berbagai produknya adalah salah satu faktor penting yang membuat generasi muda semakin menjauh dengan bahasa daerahnya. Namun penulis justru kebalikannya, berkeyakinan bahwa globalisasi dan modernisasi bisa menjadi salah satu alat untuk mendekatkan generasi muda dengan bahasa daerahnya. Globalisasi dan modernisasi sudah kita sadari bersama, tidak mungkin dihindari. Oleh karenanya, tidak perlu dimusuhi. Justru sebisa mungkin kitalah yang harus memanfaatkannya untuk kepentingan kita bersama. Dalam hal ini, penulis melihat saat ini generasi muda kita sedang mengalami tren menggunakan smartphone sebagai salah satu media komunikasi. Semakin hari semakin terasa betapa intensnya mereka menggunakan perangkat ini. Hal ini tidak bisa dielakkan. 110 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 110 8/2/16 11:19 AM Oleh karenanya penulis menawarkan bagaimana caranya mendekatkan masyarakat (utamanya generasi muda) kepada bahasa daerahnya dengan memanfaatkan produk modern ini. Bagaimana generasi muda sebagai pengguna smartphone bisa tetap dekat dengan bahasa daerahnya? Salah satu caranya adalah dengan menyediakan ‘bahasa daerah’ tersebut di perangkat yang mereka gunakan. Dalam hal ini, penulis menawarkan perancangan kamus mobile bahasa daerah (Madura) sebagai salah satu upaya untuk mendekatkan kembali generasi muda dengan bahasa daerahnya. Harapannya, dengan semakin akrabnya mereka dengan bahasa daerahnya, maka bahasa daerah tersebut juga akan semakin lestari. 1.2 Masalah Permasalahan yang diangkat dalam makalah ini adalah bagaimanakah perancangan kamus mobile bahasa Madura berbasis Android untuk mendukung upaya pelestarian bahasa daerah? 1.3 Tujuan Tujuan yang hendak dicapai dalam makalah ini adalah merancang kamus mobile bahasa Madura berbasis Android untuk mendukung upaya pelestarian bahasa daerah. 1.4 Tinjauan Pustaka Upaya memanfaatkan teknologi untuk pembelajaran bahasa daerah di Indonesia sudah dilakukan oleh banyak programmer. Beberapa diantaranya adalah Farida (2015), Lamusu, Koniyo dan Rahandi (2013), Ely, Simon dan Irwansyah (2013), Sembiring (2013), dan Priharyanto (2012). Farida (2015) menulis artikel “Aplikasi Kamus Indonesia-Jawa Berbasis Android”. Karya Farida (215) ini dilatarbelakangi keprihatinannya karena generasi muda yang semakin tidak mengenal bahasa daerahnya (Jawa) dengan baik dan benar. Dia menghasilkan aplikasi kamus yang menerjemahkan kata bahasa Indonesia ke Bahasa Jawa dengan tiga tingkatannya - ngoko, krama madya dan krama inggil. Sedangkan metode yang digunakan dalam program ini adalah metode Sequential Search dan database JSON (Java Script Object Notation). Lamusu, Konito dan Rahandi (2013), membuat aplikasi kamus 3 bahasa – bahasa Gorontalo, bahasa Indonesia dan bahasa Inggris. pembuatan aplikasi ini selain dilatarbelakangi oleh kenyataan bahwa bahasa daerah (Gorontalo) mulai ditinggalkan oleh masyarakat penuturnya, juga karena kesadaran penulisnya akan kekayaan adat dan budaya Gorontalo. Penulis ingin memudahkan para pendatang/wisatawan, baik yang berasal dari daerah lain maupun dari luar negeri untuk mengenal dan berinteraksi dengan masyarakat asli Gorontalo. Aplikasi ini menggunakan metode Hashmap yang digunakan untuk eisiensi pencarian kata. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 111 111 8/2/16 11:19 AM Ely, Simon dan Irwansyah (2013) menghasilkan alikasi kamus lima bahasa daerah di Indonesia yaitu bahasa Melayu, Minang, Jawa, Sunda dan Batak. Sedangkan Sembiring (2013) menghasilkan Aplikasi Kamus Bahasa Indonesia – Karo Online Berbasis Web. Sebelumnya, pada tahun 2012, Priharyanto juga sudah membuat aplikasi kamus dwi bahasa, yaitu kamus bahasa Indonesia-Jawa. Berbeda dengan karya Farida (2015) yang menghasilkan terjemahan kata bahasa Indonesia dalam bahasa Jawa dengan 3 tingkatan sosialnya, karya Priharyanto (2012) menampilkan arti kata bahasa Indonesia dalam bahasa Jawa dengan aksara Jawa. Sejauh ini, menurut pengamatan penulis, semua karya tersebut dihasilkan oleh para ahli IT, yang nota bene tidak memiliki latar belakang keilmuan di bidang bahasa. Hal ini tentu saja suatu hal yang positif dan menggembirakan sehingga harus juga ditanggapi dengan positif dalam upaya pelesatarian bahasa daerah. Lebih lanjut, banyak dari karya tersebut yang ditulis ‘hanya’ dalam rangka untuk memenuhi tugas akademis saja. Harapan penulis, kedepannya, karya-karya ini bisa dipublikasikan secara luas dan semakin lengkap dan komprehensif. Tempat publikasi aplikasi berbasis android yang paling efektif tentu saja di android market atau yang sekarang dikenal dengan Play Store. Namun sampai saat ini penulis belum menemukan aplikasi kamus bahasa Madura di Play Store. II. KERANGKA TEORI DAN METODE PENELITIAN 2.1 Kepunahan Bahasa (daerah) Grimes (2000) menjelaskan ada setidaknya enam gejala yang bisa dijadikan petunjuk bahwa suatu bahasa akan punah. Yang pertama adalah penurunan jumlah penutur aktif bahasa tersebut secara drastic. Yang kedua, ranah penggunaan bahasa tersebut semakin berkurang. Yang ketiga, saat bahasa ibu sudah mulai diabaikan oleh generasi mudanya. Yang keempat, ketika usaha-usaha untuk merawat identitas etnis tidak lagi menggunakan bahasa ibu. Yang kelima, ketika penutur generasi terakhir sudah tidak lagi cakap dan terampil dalam menggunakan bahasa tersebut (understanding without speaking) dan yang keenam, contoh-contoh mengenai semakin punahnya variasi-variasi (dialek) satu bahasa, keterancaman bahasa Kreol dan bahasa sandi. Sedangkan Summer Insitute of Linguistics (SIL) (2008) menyebutkan ada dua belas faktor yang berhubungan dengan kepunahan bahasa, (1) kecilnya jumlah penutur, (2) usia penutur, (3) penggunaan bahasa ibu oleh anak-anak, (4) penggunaan bahasa lain secara reguler dalam aneka latar budaya. (5) perasaan identitas etnik dan sikap terhadap bahasanya secara umum, (6) urbanisasi kaum muda, (7) kebijakan pemerintah, 112 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 112 8/2/16 11:19 AM (8) penggunaan bahasa dalam pendidikan, (9) intrusi dan eksploitasi ekonomi, (10) keberaksaraan, (11) kebersastraan, dan (12) kedinamisan para penutur membaca dan menulis sastra. Menurut Darwis (2011), selain faktor-faktor tersebut di atas, ada satu tambahan faktor penting lannya terkait dengan kepunahan baasa daerah, yaitu tekanan dominasi bahasa lain (bahasa Indonesia dan bahasa Asing – Inggris). Apabila kita mencermati faktor-faktor tersebut di atas, kita akan menyadari bahwa hampir semua bahasa daerah di Indonesia mengalami gejala kepunahan bahasa, termasuk bahasa Madura. 2.2 Upaya Pelestarian Bahasa Daerah dalam Perencanaan Bahasa Pembuatan kamus adalah salah satu langkah penting dalam dalam upaya pelestarian suatu bahasa, dalam hal ini adalah bahasa daerah (Madura). Sekalipun begitu, pembuatan kamus hanyalah sebagian dari langkah (kodiikasi) perencanaan bahasa (language planning). Haugen (1966) menawarkan empat langkah dalam perencanaan bahasa yang meliputi: a. Pemilihan (selection), yaitu penentuan bahasa/variasi bahasa mana yang akan dijadikan obyek. b. Kodiikasi (codiication), yaitu pengembangan dari bahasa atau variasi bahasa yang sudah dipilih. Termasuk dalam kodiikasi adalah penentuan ragam bahasa standard dan ragam bahasa yang lainnya, pembuatan kamus, grammar dan sebagainya. c. Penerapan (implementation), yaitu usaha untuk menerapkan dan menyebarluaskan bahasa yang sudah dipilih. d. Pengembangan (elaboration), merupakan usaha terus menerus untuk memperbaharui bahasa terpilih agar selalu sesuai dengan jamannya dan selalu bisa memenuhi semua kebutuhan penggunanya. Fishman (1977) menambahkan bahwa perencanaan bahasa akan berhasil apabila didukung oleh semua pihak, khususnya: pemerintah atau menteri terkait, pendidik, ahli bahasa, hakim, kalangan swasta, dan rakyat sendiri. Jadi perencanaan bahasa yang baik, memerlukan partisipasi aktif dari semua pihak. Lebih lanjut, Ferguson menyatakan bahwa ciri-ciri bahasa yang memudahkan masyarakat awam menerima perencanaan bahasa adalah sebagai berikut. a. Bahasa itu adalah bahasa pribumi (penduduk asli) atau bahasa ibu negara itu. b. Bahasa itu pernah menjadi lingua franca dalam negara itu dan antarnegara tetangga. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 113 113 8/2/16 11:19 AM c. Bahasa itu berpotensi (kreatif dan leksibel) untuk perkembangan pendidikan, agama, sastra, iptek (ilmu pengetahuan dan teknologi), dan media massa. d. Bahasa itu mempunyai budaya yang mantap dan agung. e. Sejarah bahasa itu mantap dan sahih. f. Bahasa itu mempunyai banyak bahan dokumentasi untuk dikaji. g. Bahasa itu mempunyai pakar tradisional dan modern. h. Bahasa itu mempunyai kebijakan (policy) perencanaan yang dilakukan oleh individu atau kelompok yang cinta bahasanya. i. Bahasa itu dihormati oleh pemakainya dan masyarakat pemakai kelompok lain. j. Bahasa itu mempunyai ciri kebangsaan atau nasional. k. Bahasa itu mempunyai daya tarik yang memudahkan pemakainya taat dan setia kepadanya. l. Bahasa itu mudah memupuk persatuan bangsa dan negara. Pelaksanaan perencanaan bahasa ini kemungkinan besar akan mengalami hambatan yang mungkin akibat dari perencanaannya yang kurang tepat; bisa juga dari para pemegang tampuk kebijakan, dari kelompok sosial tertentu, dari sikap bahasa para penutur, maupun dari dana dan ketenagaan. Perencanaan yang kurang tepat bisa bersumber dari pengambilan kebijakan yang tidak tepat atau keliru, karena salah mengestimasi masalah kebahasaan yang harus diteliti. 2.3 Bahasa Madura Bahasa Madura masuk dalam kerabat bahasa Austronesia dan digunakan oleh suku Madura. Bahasa daerah ini tidak anya digunakan di pulau Madura saja, karena suku Madura sudah tersebar ke berbagai wilayah Indonesia. Namun yang paling utama, selain di pulau Madura sendiri, bahasa ini juga digunakan penduduk di pulau-pulau kecil di sekitar pulau Madura. Bahasa Madura juga digunakan oleh penduduk di beberapa daerah di propisi Jawa Timur, di bagian pesisir utara (Surabaya, Pasuruan, Probolinggo, Situbondo, Bondowoso, Jember and Lumajang) dan di bagian barat dan selatan pulau Kalimantan. Tidak seperti halnya bahasa Indonesia yag tidak mengenal adanya tingkat tutur, bahasa Madura mengenal adanya tingkatan sosial tuturan. Secara umum, tingkat tutur dalam bahasa Madura ada tiga: enja-iya, engghi enten dan engghi bhunten. Sedangkan jumlah bunyi vokal bahasa Madura sama dengan bahasa Indonesia, yaitu ada enam bunyi vokal. Namun bunyi vokal bahasa Madura tidak sama dengan bahasa Indonesia. Vokal dalam bahasa Madura adalah /a/, /i/, /u/, /o/, /ə/, dan /o/. Untuk bunyi konsonan dalam bahasa Madura, ada 31 bunyi. (Sofyan, 2008). Untuk sistem ejaan bahasa Madura, sayangnya sampai saat ini masih belum benar-benar seragam. Masih ada perdebatan diantara sesama ahli bahasa Madura yang sampai sekarang belum mencapai titik temu yang memuaskan. Misalnya bunyi hamzah harus dituliskan dengan lambang tersendiri 114 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 114 8/2/16 11:19 AM atau cukup menggunakan apostroph (Sofyan, 2008). Sistem ejaan yang belum standar ini menjadi salah satu kendala dalam penyusunan kamus. 2.4 Kamus Kamus merupakan buku rujukan yang berisi kata-kata dan keterangannya. Buku ini berguna untuk membantu seseorang mengenal kata-kata baru. Selain menerangkan arti kata, kamus tertentu juga mungkin mempunyai pedoman sebutan, asal-usul (etimologi) suatu kata dan juga contoh penggunaannya dalam sebuah kalimat. Untuk memperjelas kadang kala terdapat juga ilustrasi di dalam kamus. Fungsi lain kamus adalah juga sebagai kebanggaan identitas suatu bahasa dan bangsa (Dep. Pendidikan dan Kebudayaan, 2002:499). Saat ini kita mengenal ada berbagai macam jenis kamus. Dari kamus berbentuk buku, aplikasi kamus yang terpasang di koputer atau laptop, kamus online yang selalu tersedia di web-web tertentu sampai kamus digital yang mobile yang terpasang di smartphone kita. Kamus digital mempunyai keunggulan disbanding kamus-kamus tradisional yang berbentuk buku. Dari sisi ukuran, jelas kamus digital jauh lebih praktis, karena sudah terpasang di perangkat mobile kita. Dari sisi berat, menambahkan aplikasi kamus dalam perangkat mobile tidak akan menambah berat perangkat tersebut. Sedangkan dari sisi kepraktisan, kamus digital jauh lebih unggul karena untuk mencari arti kata, kita tidak perlu lagi membuka buku kamus berlembar-lembar, cukup ketikkan kata yang akan kita cari, aplikasi akan bekerja secara otomatis untuk menemukan arti kata yang kita ketikkan. Salah satu operating system paling popular untuk perangkat mobile saat ini adalah OS Android yang diproduksi oleh perusahaan Google. 2.5. Android Android adalah sistem operasi berbasis Linux yang saat telah menjadi sistem operasi yang paling populer di telepon selular, smart phone, dan komputer tablet. Android adalah platform terbuka (open source) bagi para pengembang (developer). Sehingga para pengembang bisa menciptakan aplikasi mereka sendiri yang bisa di pasang di perangkat mobile. Karena Android bersifat open source maka banyak pihak yang tertarik dan menggunakannya untuk perangkat mobilenya. Akibatnya, android berkembang dengan sangat cepat. Sampai kini Google telah mengeluarkan android dengan berbagai versi. Android pertama kali dikeluarkan pada tahun 2007 pada perangkat Nexus One. Kemudian android semakin dikembangkan dengan menambahkan itur-itur di versi-versi Android yang lebih baru; mulai dari Android 1.1 kemudian dikembangan di versi 1.5 (Cupcake), 1.6 (Donut), Android versi 2.0/2.1 (Eclair), Android 2.2 Froyo (Frozen Yoghurt), Android Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 115 115 8/2/16 11:19 AM versi 2.3 (Gingerbread), Android versi 3.0/3.1 (Honeycomb), Android 4.0 Ice Cream, 4.1 Jellybeans, dan sampai yang terakhir tahun 2016 ini akan dikelarkan android terbaru, android Marshmalow (Safaat, 2012). III. Analisis Penelitian 3.1 Analisis sistem, kebutuhan input, proses, output dan sistem Mengikuti perkembangan jaman, kita tidak boleh kalah oleh arus globalisasi. Justru seharusnya, globalisasi dan modernisasi ini kita manfaatkan untuk melestarikan bahasabahasa daerah di Indonesia. Saat ini banyak generasi muda yang mulai meninggalkan bahasa- bahasa daerahnya masing-masing. Pada sisi lain, hampir semua generasi muda kita saat ini memegang perangkat mobile atau smartphone. Dengan teknologi, smartphone saat ini tidak hanya berguna sebagai alat komunikasi saja. Dengan berbagai macam aplikasi yang ada, perangkat mobile ini bisa diberdayakan sebagai alat untuk belajar bahasa daerah. Salah satu aplikasi yang penting untuk belajar bahasa ini adalah aplikasi kamus mobile di Android. Aplikasi kamus di perangkat mobile ini dapat membantu pembelajaran bahasa secara praktis dan membantu melestarikan bahasa daerah (Madura). Pencarian atau terjemahan kata pada aplikasi kamus mobile Android dapat menjadi lebih mudah dan cepat, dikarenakan oleh algoritma dan metode yang digunakan oleh aplikasi kamus tersebut. Penelitian ini akan menerapkan AutoCompleteTextView dan metode Hashmap untuk pencarian kata dalam database SQLite. Kata yang diinputkan dalam aplikasi ini berupa teks dalam bahasa Indonesia atau Madura. Kemudian AutoCompleteTextView akan berfungsi untuk menampilkan daftar saran kata yang dicari sesuai awalan huruf yang diketikan oleh pengguna. Ketika pengguna mengetikkan kata yang akan dicari pada ield pencarian, sistem akan langsung merespose dengan mengurutkan data dalam database sesuai dengan huruf yang diketikkan oleh pengguna. Dalam proses ini, sekaligus, sistem akan menampilkan hasil pengurutan data tersebut untuk memudahkan pengguna memilih kata yang dikehendakinya (AutoCompleteTextView) agar proses lebih cepat. Namun pengguna tetap bisa mengetikkan kata yang akan dicari, tanpa memilih kata-kata yang sudah ditampilkan. Proses ini berjalan terus selama pengguna mengetikkan kata yang akan dicari. Output yang akan ditampilkan oleh aplikasi ini adalah padanan kata yang dicari dalam bahasa Indonesia dan Madura. Jika kata yang dimaksud sudah ada dalam database, maka hasil pencarian akan ditampilkan pada bidang terpisah sedangkan jika tidak ditemukan dalam database, maka akan muncul pesan yang memberitahukan bahwa kata yang dicari tidak ada. 116 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 116 8/2/16 11:19 AM Untuk analisa kebutuhan sistem aplikasi ini adalah sebagai berikut: a. Aplikasi menyediakan menu untuk pencarian kata dalam bahasa Indonesi dan Madura. b. Aplikasi mampu mecari padanan kata - kata Bahasa Indonesia dan Madura atau sebaliknya. c. Aplikasi bisa menampilkan daftar saran kata sesuai dengan huruf yang diketikan pengguna pada kolom pencarian. d. Aplikasi bisa menampilkan padanan kata - kata Bahasa Indonesia dan Madura atau sebaliknya jika data ditemukan dalam database. Jika tidak ditemukan dalam database, aplikasi akan menampilkan pesan pemberitahuan. 3.2 Perancangan Aplikasi Kamus 3.2.1 Use case diagram Use case diagram ini berfungsi untuk memberikan gambara penggunaan fungsi sistem sehingga pengguna memahami fungsi sistem aplikasi yang dirancang. 3.2.2 Activity Diagram Activity diagram memberikan gambaran langkah-langkah dalam aliran kerja sitem. Diagram ini akan menjelaskan siapa yang melakukan apa dan sampai tahap apa dan akan dilanjutkan oleh siapa. 3.2.3 Sequence diagram Sequence diagram adalah diagram untuk menggambarkan bagaimana suatu operasi dilakukan, pesan apa yang dikirimkan dan waktu pelaksanannya. Diagram ini bermanfaat untuk menggambarkan rangkaian langkah-langkah yang dilakukan sebagai jawaban (response) dari suatu event untuk menghasilkan sebuah output tertentu serta menjelaskan perubaan inernal apa saja yang terjadi selama proses tersebut. 3.2.4 Story board Kamus Pada saat aplikasi dibuka, akan langsung muncul tampilan kamus. Pada bagian awal ini ada label judul aplikasi, yaitu Kamus bahasa Madura-Indonesia. dibawahnya ada radio button berisi pilihan kamus yang aan digunakan, Madura-Indonesia atau sebaliknya Indonesia-Madura. Diikuti dengan ield kolom pencarian. Dibawah kolom tersebut disediakan tombol “cari” untuk memulai pencarian. Hasil pencarian akan langsung ditampilkan dibawah tombol tersebut. Namun jika data tidak ditemukan, maka yang muncul dibawah tombol adalah pemberitahuan. Tombol keluar untk menutup aplikasi diletakkan di bagian paling bawah. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 117 117 8/2/16 11:19 AM IV. SIMPULAN Globalisasi dan modernisasi bisa berakibat negatif pada perkembangan bahasabahasa daerah (Madura). namun pada sisi yang lain, globalisasi dan modernisasi bisa dimanfaatkan untuk melestarikan dan mengembangkan bahasa- bahasa daerah di Indonesia. Smartphone sebagai salah satu produk modernisasi bisa dimanfaatkan untuk mendekatkan kembali bahasa-bahasa daerah dengan generasi muda penuturnya. Salah satu caranya adalah dengan menghadirkan kamus bahasa daerah untuk perangkat mobile tersebut. Penggunaan kamus mobile selain lebih cepat menemukan kata yang dicari juga jauh lebih praktis dibanding penggunaan kamus konvensional. Diharapkan dengan semakin dekatnya generasi muda dengan bahasa daerahnya, bahasa-bahasa daerah di Indonesia semakin terjaga kelestariannya. Daftar Pustaka Azhar, Iqbal Nurul, 2008. Ketika bahasa madura tidak lagi bersahabat dengan kertas dan tinta (Sebuah Kajian Ethnolinguistics Ditinjau Dari Sudut Pandang Sosiolingistics) dalam Bahasa dan Sastra dalam Berbagai Perspektif. the Faculty of Language and Art, Yogyakarta State University dan Tiara Wacana publisher. Budiwiyanto, Adi. (TT). Pendokumentasian bahasa dalam upaya revitalisasi bahasa daerah yang terancam punah di Indonesia. Diambil dari laman http://badanbahasa. kemdikbud.go.id/lamanbahasa/artikel/1823 Darwis, Muhammad, M.S. 2011. Nasib bahasa daerah di era globalisasi: Peluang dan tantangan, Makalah pada Workshop Pelestarian Bahasa Daerah Bugis Makassar, Balitbang Agama. Makassar. Departemen Pendidikan dan Kebudayaan. 2002. Kamus besar bahasa indonesia edisi ketiga. Jakarta: Balai Pustaka Ely, Kurniawan Dwi, dkk. 2013. Aplikasi kamus aneka bahasa daerah berbasis smartphone Android. Seminar Nasional Teknologi Informasi, Komunikasi dan Industri (SNTIKI) 5, Pekanbaru, 2 Oktober 2013, Farida, Intan Nur. 2015. Aplikasi kamus indonesia-jawa berbasis android. Nusantara of Engineering. Vol. 2. No. 1 diambil dari laman http://efektor.unpkediri.ac.id/index. php/ti/article/viewFile/90/60 Fishman. Joshua, A. 1977. Advances in language planning. De Gruyter Grimes, B. F. Ed. 1988. Ethnologue: languages of the world. Dallas, Texas: Summer Institute of Linguistics, Inc 118 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 118 8/2/16 11:19 AM Lamusu, M. N. F, Koniyo, M. H., dan Rahandi, M (2013), Pembuatan aplikasi kamus 3 bahasa pada smartphone android. Jurnal Karya Ilmiah Mahasiswa Fakultas Teknik, Vol. 01 No. 01 Lontar Madura. 2012. Marginalisasi bahasa Madura dan usaha-usaha pengembangannya. Diambil dari laman http://www.lontarmadura.com/marginalisasi-bahasa-madurausaha-pengembangannya/ Misnadin. 2011. An observation towards some phonological rules and processes in Madurese, Prosodi Volume V, Nomor 2, Juli Moseley, Christopher. 2010. Atlas of the world’s languages in danger. UNESCO Publishing Mubah, A. S. 2011. Strategi meningkatkan daya tahan budaya lokal dalam menghadapi arus globalisasi. Jurnal Unair, Vol. 24 No. 4 Priharyanto, Ibnu. 2012. Aplikasi kamus bahasa indonesia – jawa – jawa krama berbasis android. Diambil dari laman http://repository.amikom.ac.id/files/ Publikasi2010.21.0489.pdf Safaat, H Nazaruddin. 2012. Android : Pemrograman aplikasi mobile smartphone dan tablet pc berbasis Android. Bandung : Informatika.. Santoso, Teguh. (TT). Menatap masa depan bahasa daerah: studi kasus di aceh. Diambil dari laman http://badanbahasa.kemdikbud.go.id/lamanbahasa/artikel/1291 Sembiring, Jhoni Pranata. 2013. Perancangan aplikasi kamus bahasa indonesia - karo online berbasis web dengan Metode Sequential Search. Pelita Informatika Budi Darma, Volume : IV, Nomor: 2 Sofyan, Akhmad. 2008. Variasi, keunikan dan penggunnaan bahasa madura, Departemen Pendidikan Nasional, Pusat Bahasa, Balai Bahasa Surabaya www.ethnologue.com. 2016. Madura. Diambil dari laman www.ethnologue.com/language/ mad Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 119 119 8/2/16 11:19 AM 120 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 120 8/2/16 11:19 AM Pengembangan WordNet Bahasa-Bahasa Daerah di Indonesia: Kasus WordNet Bahasa Jawa Totok Suhardijanto Universitas Indonesia [email protected] Abstrak Salah satu tantangan masa kini yang dihadapi para peneliti dan pegiat kebahasaan di dunia adalah upaya penyusunan sumber daya bahasa dalam bentuk digital. Pada masa mendatang, semua bahasa, termasuk bahasa daerah di Indonesia, sebaiknya harus mempunyai pangkalan data elektronik. Dalam kerangka itulah, makalah ini menyoal tantangan dan peluang dalam pembentukan WordNet Bahasa Jawa. Wordnet merupakan pangkalan data leksikal dalam bentuk jaringan semantik. Wordnet paling luas cakupan dan penerapannya dalam pemrosesan bahasa alami, misalnya analisis sentimen, mesin terjemahan, dan aplikasi pembedaan kata. Ada dua pendekatan yang lazim digunakan dalam membangun wordnet untuk bahasa yang baru: pendekatan penggabungan (merge approach) dan peluasan (extend approach). Pendekatan penggabungan mengambil sumberdaya ekabahasa yang ada dan memetakannya ke dalam struktur wordnet. Pendekatan penambahan menggunakan set sinonimi (sinset) dari WordNet Princeton dan menambahkan lema dari bahasa sasaran. Makalah ini membahas pendekatan mana yang digunakan dalam pengembangan WordNet bahasa Jawa dan apa kelebihan dan kekurangannya. Selain itu, dalam makalah ini dibahas aspek teknis dan leksikograis yang terkait dengan pengembangan wordnet untuk bahasa Jawa. Kata Kunci: wordnet, sinset, metode peluasan, metode penggabungan, bahasa Jawa Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 121 121 8/2/16 11:19 AM I. PENDAHULUAN Wordnet yang pertama kali diciptakan di Laboratorium Ilmu Kognitif Princeton University merupakan salah satu pangkalan data leksikal elektronik yang paling banyak dan paling luas digunakan. Data leksikal dalam pangkalan data ini disusun menurut jaringan semantiknya (Fellbaum 1998). Di dalam wordnet, kelas terbuka seperti nomina, verba, adjektiva dan adverbia dikelompokkan ke dalam set sinonim kognitif (cognitive synonym set) yang disingkat synset (dalam makalah ini selanjutnya disebut sinset). Sinset ini ditautkan satu sama lain dengan relasi semantis seperti sinonimi, antonimi, atau hiponimi. Wordnet versi 3.0 yang paling mutakhir saat ini memiliki lebih dari 117.000 sinset (http://wordnet.princeton.edu/). Gambar 1. Subset Wordnet Princeton University Menurut Fellbaum, Wordnet tidak hanya berkembang dari segi ukuran, tetapi juga dalam jumlah bahasa yang dimasukkan ke dalam pangkalan data wordnet di seluruh dunia. Wordnet telah mengilhami banyak peneliti untuk mengembangkannya ke dalam bahasa lain, khususnya bahasa-bahasa di Asia (lihat Bond dkk 2014; Tan dan Lim 2010; Thoongsup 2009; Isahara 2008). Banyaknya penerapan wordnet pada bahasa-bahasa di Asia menjadi salah satu alasan penyusunan wordnet bahasa Jawa ini. Makalah ini menyajikan pengembangan Wordnet Bahasa Jawa (selanjutnya disingkat WBJ) yang dilakukan secara semi-otomatis. Hingga saat ini, leksikon semantis bahasa Jawa yang terhubung dan dapat diakses secara luas belum ada. Mengapa bahasa Jawa menjadi penting untuk diterapkan ke dalam sistem pangkalan data leksikal elektronis WordNet? Paling tidak ada beberapa alasan. Pertama, Bahasa Jawa merupakan salah satu bahasa utama di wilayah Asia Tenggara dengan total penutur berjumlah 84 juta orang penutur yang wilayah tradisionalnya meliputi Propinsi Jawa Tengah, Jawa Timur, dan Daerah Istimewa Yogyakarta. Kedua, bahasa Jawa juga memiliki tiga dialek utama, yakni timur, tengah, dan barat, serta tiga jenis ragam, yakni ngoko, madya, dan krama 122 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 122 8/2/16 11:19 AM yang tentunya cukup menantang dari segi teknologi dalam penanganan aspek dialektal dan ragam tersebut. Oleh sebab itu, dalam pengembangan WBJ ini, dipilih dialek tengah sebagai dasar karena dialek ini dianggap dialek standar bahasa Jawa (lihat Subroto dkk 1991). Pada proyek ini digunakan 5000 kosakata atau sinset inti dari Wordnet Bahasa Inggris Princeton (selanjutnya disingkat WBIP) (http://wordnet.princeton.edu/). Namun, untuk tahap pertama, pengembangan WBJ baru dilakukan dengan 2000 sinset. Dalam penelitian ini, , WBJ disusun dengan menggunakan kamus dwibahasa dengan berdasarkan WBIP. Kamus dwibahasa ini disusun berdasarkan kamus bahasa JawaInggris (Robson & Wibisono 2002). Sinset dalam WBJ disejajarkan dengan sinset WBIP melalui bahasa Inggris sebagai perantara. Dalam proses penjajaran, dilakukan pula penerjemahan manual. II. POKOK BAHASAN DAN TUJUAN PENULISAN Dalam makalah ilmiah, fokus pembicaraan berkenaan dengan penyusunan pangkalan data leksikal elektronik WBJ. Lebih lanjut, secara lebih detail, pada makalah ini perhatian dititikberatkan pada tiga permasalahan, yakni metode mana yang paling sesuai digunakan, aspek-aspek bahasa Jawa apa saja yang menjadi kendala dan tantangan dalam penyusunan WBJ, dan bagaimana mengatasi kendala dan tantangan tersebut. Oleh sebab itu, makalah ilmiah ini bertujuan untuk mengungkapkan metode yang tepat dalam penyusunan WBJ. Selain itu, dalam makalah ini, juga diidentiikasi beberapa aspek bahasa Jawa yang potensial menjadi kendala dan tantangan dalam penyusunan WBJ secara teknis. Kemudian, pada makalah ini, juga dieksplorasi cara dan teknik untuk mengatasi kendala-kendala yang muncul terkait dengan bahasa Jawa. III. PENDEKATAN DAN METODE Pada bagian ini dibahas pendekatan dan metode yang digunakan dalam penyusunan WBJ. Bagian Pendekatan dan metode ini dipilah ke dalam dua subbagian agar pembicaraan mengenai keduanya berjalan dengan lebih sistematis, lengkap, dan mendalam. 3.1 Pendekatan Seperti yang dikemukakan sebelumnya, dalam pengembangan wordnet untuk bahasa baru, lazim ditempuh dengan dua pendekatan: metode penggabungan dan metode peluasan. Kedua pendekatan ini mempunyai kekurangan dan kelebihan. Dalam metode penggabungan, taksonomi bahasa baru (sinset dan relasi) dibuat dan kemudian diperakan ke struktur WBIP. Dengan pendekatan ini, diciptakan struktur wordnet baru karena pangkalan datanya disusun berdasarkan taksonomi bahasa tertentu. Meskipun demikian, bagi bahasa minor atau bahasa yang jarang diteliti, pendekatan Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 123 123 8/2/16 11:19 AM inilah yang paling sesuai karena sulit menemukan kamus dwibahasa dalam bahasabahasa seperti demikian. Pada pendekatan peluasan, bahasa baru diterjemahkan langsung ke WBIP dengan menambahkan kosakata bahasa baru ke WBIP. Pendekatan ini mempertahankan struktur asli BWIP karena bahasa baru diproyeksikan ke WBIP dengan menggunakan struktur aslinya. Pendekatan ini sederhana dan hasilnya dapat disejajarkan secara otomatis dengan wordnet bahasa-bahasa lainnya (Clark dkk 2008a dan 2008b). Meskipun demikian, dalam hal bahasa Jawa, beberapa konsep bahasa Jawa yang tidak ada di dalam WBIP tidak akan ada di dalam pangkalan data leksikon yang disusun. 3.2 Metode Seperti disebutkan pada bagian sebelumnya, pada makalah ini, digunakan pendekatan peluasan untuk membangun WBJ dengan menerjemahkan sinset WBIP ke dalam bahasa Jawa. Pada tahap pertama, dikembangkan WBJ dengan 2000 sinset yang berasal dari 5000 makna dasar kata di dalam WBIP. Kata yang berjumlah 5000 tersebut merupakan makna kata yang paling sering digunakan dalam bahasa Inggris. a [distant%3:00:01::] [distant] separated in space or time a [distinct%3:00:00::] [distinct] easy to perceive a [domestic%3:00:00::] [domestic] concerning the internal affairs of a nation a [domestic%3:01:00::] [domestic] relating to the home n [igure%1:06:01::] [igure] design, pattern n [igure%1:21:00::] [igure] amount of money expressed numerically n [ile%1:06:00::] [ile] steel hand tool n [ile%1:06:01::] [ile] ile cabinet, iling cabinet n [ile%1:10:00::] [ile] data ile n [ile%1:14:00::] [ile] single ile, Indian ile v [amuse%2:32:00::] [amuse] make laugh v [answer%2:32:00::] [answer] reply, respond v [apologise%2:32:00::] [apologize] v [appeal%2:41:04::] [appeal] challenge a decision v [appear%2:30:00::] [appear] come into view Gambar 2 Contoh Daftar Kosakata Dasar WordNet Princeton University Penerjemahan makna dasar kata ke dalam bahasa Jawa dilakukan secara manual dengan menggunakan aplikasi berbasis web. Penerjemahan dilakukan oleh penutur asli bahasa Jawa yang terdiri atas peneliti dan mahasiswa jurusan Jawa di lingkungan FIB Universitas Indonesia. 124 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 124 8/2/16 11:19 AM IV. PEMBAHASAN Pada bagian ini, akan dibahas isu-isu yang muncul baik terkait teknis penyusunan maupun terkait sifat dan karakter kedua bahasa yang terkait dengan proyek penyusunan wordnet ini, yakni bahasa Jawa dan bahasa Inggris. Oleh karena itu, pada bagian ini, akan dibahas dua hal, yakni penerjemahan sinset dan isu-isu kebahasaan. 4.1 Penerjemahan Sinset Pada bagian ini dibahas permasalahan yang muncul dalam proses pengembangan WBJ. Ada dua isu penting terkait dengan proses pengembangan WBJ, yakni yang terkait dengan struktur WBIP dan yang terkait dengan karakteristik bahasa Jawa. Meskipun demikian, dalam makalah ringkas ini hanya akan dibahas isu pertama. Pada makalah versi lengkap, isu terkait karakteristik bahasa Jawa akan dibahas secara panjang lebar. Selanjutnya, pada bagian ini membahas bagaimana menangani konsep yang tidak mempunyai padanan dalam leksikon bahasa Jawa. Untuk mengatasi hal ini, apakah mungkin menggunakan kata majemuk atau frasa? Sebagai contoh, colt -- (a young male horse under the age of four) mare -- (female equine animal) stallion -- (uncastrated adult male horse) Dalam hal ini, frasa atau kata majemuk akan digunakan sebagai padanan unsur leksikal. Misalnya, untuk menerjemahkan mare digunakan frasa jaran wedok yang secara hariah bermakna ‘kuda betina dewasa’). Isu lain yang tidak kalah penting adalah mana yang lebih baik: penerjemah sinset dengan sinset atau penerjemahan kata? Dalam bahasa Inggris, misalnya, konsep goat terdiri atas tiga kata: goat, caprine, animal. WBIP: • goat, caprine animal -- (any of numerous agile ruminants related to sheep but having a beard and straight horns) Dalam bahasa Jawa, padanan sinset goat adalah WBJ: a) wedhus ‘goat’ (plain word) b) menda ‘goat’ (high polite word) c) kambing ‘caprine animal’ Jadi, pertanyaannya adalah bagaimana memilih kosakata Jawa yang tepat untuk padanan bahasa Inggrisnya? Hal ini penting karena tiga kosakata bahasa Inggris digunakan dalam konteks yang berbeda dalam bahasa Jawa. Untuk alasan ini, dalam hal ini, penerjemahan kata dengan kata merupakan solusi terbaik. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 125 125 8/2/16 11:19 AM 1) goat a) wedhus (plain word) b) menda (high polite word) 2) caprine animal c) kambing (generic term) Dengan demikian, prinsip penerjemahan yang digunakan dalam penyusunan WBJ adalah sebagai berikut. • Kata tunggal hanya digunakan untuk konsep yang terleksikalisasi dalam bahasa Jawa: milk > susu • Kata majemuk/frasa digunakan untuk beberapa konsep yang tidak ditemukan padanan katanya dalam bahasa Jawa: stallion > jaran lanang • Pemadanan sinset ke sinset digunakan untuk sinset bahasa Jawa bersesuaian dengan sinset dalam sistem WBIP. • Pemadanan kata dengan kata digunakan untuk kosakata bahasa Jawa yang bersesuaian dengan kata-kata yang ada pada sinset di dalam WBIP. 4.2 Isu-Isu Kebahasaan Paling tidak ada tiga isu terkait bahasa yang perlu ditangani dalam penyusunan WBJ. Isu-isu tersebut adalah bagaimana menangani masalah dialek atau subdialek, ragam, dan tidak adanya konsep ekuivalen di antara sinset WBJ dan WBIP. Sebagaimana diketahui, bahasa Jawa memiliki tiga dialek utama, yakni dialek TIMUR, TENGAH, dan BARAT. Terkait dengan dialek atau subdialek, seperti disebutkan pada bagian sebelumnya, fokus pengembangan WBJ pada tahap awal akan difokuskan pada salah satu dialek saja, yakni dialek TENGAH. Meskipun demikian, untuk pengembangan selanjutnya, masalah dialek dapat ditangani dengan penggunaan itur tag yang disediakan oleh wordnet untuk menganotasi kata lokal atau dialektal. Sebagai contoh, koen kowe rika -- (you, 2SG) + (EAST) -- (you, 2SG) + (CENTRAL) -- (you, 2SG) + (WEST) Seperti yang telah disebutkan sebelumnya ragam atau gaya bahasa Jawa terdiri atas tiga, yakni ngoko, madya, dan krama (Subroto et al. 1991). Sejalan dengan dialek, terkait dengan ragam atau gaya, dapat pula diterapkan penggunaan tag untuk menganotasi kata berdasarkan gaya. Sebagai contoh, kowe sampeyan panjenengan -- (you, 2SG) (CENTRAL) + (LOW) -- (you, 2SG) (CENTRAL) + (HIGH) -- (you, 2SG) (CENTRAL) + (POLITE HIGH) Pada tahap pertama penyusunan digunakan 5000 makna kata dasar dalam pengembangan WBJ. Meskipun tidak banyak, dijumpai beberapa konsep yang tidak 126 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 126 8/2/16 11:19 AM muncul pada salah satu bahasa, yakni bahasa Jawa atau bahasa Inggris. Untuk konsepkonsep yang tidak muncul baik dalam WBIP, akan ditambahkan sinset baru. Sebagai contoh, WBIP rice -- (grains used as food either unpolished or more often polished) bahasa Jawa beras wos sega sekul pari pantun upa menir ‘rice grain’ (plain word) ‘rice grain’ (polite word) ‘cooked rice’ (plain word) ‘cooked rice’ (polite word) ‘rice plant’ (plain word) ‘rice plant’ (polite word) ‘a single cooked rice seed’ ‘broken rice’ V. SIMPULAN Pada proses penyusunan WBJ, digunakan pendekatan peluasan karena faktor kemudahan dan kemungkinannya untuk dihubungkan dengan wordnet bahasa lain di dunia. Pada tahap pertama, disusun 2000 sinset bahasa Jawa berdasarkan 5000 makna dasar yang diperoleh dari laman web Wordnet Lexical Database for English (http:// wordnet.princeton.edu/). Dalam proses penyusunan, pertama kali dilakukan pengumpulan data dari kamus bahasa Jawa seperti Bausastra Jawa (Tim Penulis Balai Bahasa Yogyakarta 2011) dan Javanese-English Dictionary (Robson dan Wibisono 2002). Dengan data kamus tersebut, disusunlah kamus terjemahan yang berisi kosakata bahasa Inggris dan padanan katanya dalam bahasa Jawa. Kemudian, pada tahap berikutnya, dilakukan penerjemahan antarsinset dengan menggunakan aplikasi web. Penyusunan WBJ merupakan salah satu upaya untuk mempertautkan pangkalan data bahasa dengan bahasa-bahasa lain di dunia. Selain itu, penciptaan WBJ merupakan salah satu satu upaya melestarikan bahasa Jawa dengan menyimpan salah aspeknya ke dalam bentuk elektronik atau digital. Dengan demikian, sumber daya elektronik bahasa Jawa akan terwujud dan makin kaya dengan keberadaan WBJ. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 127 127 8/2/16 11:19 AM Daftar Pustaka Bond, F., Lim, L.T., Tang, E.K. and Riza, H. (2014). “The combined Wordnet Bahasa.” In Siaw-Fong Chung and Hiroki Nomoto, eds. Current Trends in Malay Linguistics, NUSA 57:83-100, 2014. Budanitsky, A., & Hirst, G. (2006). Evaluating wordnet-based measures of lexical semantic relatedness. Computational Linguistics, 32 (1), 13-47. Clark, P., Fellbaum, C., Hobbs, J., Harrison, P., Murray, W. and J. Thompson. (2008). Augmenting WordNet for Deep Understanding of Text. ACL-SigSem, Venice, Italy. Clark, P., Fellbaum, C., and Hobbs, J. (2008). Using and Extending WordNet to Support Question Answering. Dalam Proceedings of the Fourth Global WordNet Conference, eds. A. Tanacs, D. Csendes, V. Vincze, C. Fellbaum and P. Vossen. Hungary: University of Szeged, pp. 111-119. Felbaum, C. (1998). Wordnet: An electronic lexical database. MIT Press, Massachusetts, 1998. Isahara, H., Bond, F., Uchimoto, K., Utiyama, M., & Kanzaki, K. (2008). “Development of the Japanese WordNet”. In LREC, 2008. Morato, J., Marzal, M. A., Lloréns, J., & Moreiro, J. (2004). Wordnet applications. In Global Wordnet Conference (Vol. 2, pp. 270-278). Robson, S. And Wibisono, S. 2002. Javanese-English Dictionary. Periplus, Singapore. Subroto, D.E., Soenardji, dan Sugiri. (1991). Tata Bahasa Deskriptif Bahasa Jawa. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa. Tan, P.P.P.L. and Lim, N.R.T. (2010). “Toward a Filipino Wordnet.” Diambil dari http:// www.dlsu.edu.ph/research/centers/adric/nlp/downloads/paper7.pdf Thoongsup, S., Robkop, K., Mokarat, C., Sinthurahat, T., Charoenporn, T., Sornlertlamvanich, V., and Isahara, H. (2009). “Thai Wordnet Construction.” Proceedings of the 7th Workshop on Asian Language Resources, ACL-IJCNLP 2009, pages 139-144, Suntec, Singapore, 6-7 August 2009. Tim Penulis Balai Bahasa Yogyakarta. (2011). Kamus Basa Jawa (Bausastra Jawa). Edisi Kedua. Yogyakarta: Kanisius. Wordnet Lexical Database for English. (2016). http://wordnet.princeton.edu/. Diakses pada 21 Juni 2016. 128 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 128 8/2/16 11:19 AM Beberapa Kendala Pengayaan Kosakata Bahasa Indonesia dari Bahasa Daerah Asep Rahmat Hidayat Balai bahasa Jawa Barat [email protected] Abstrak Indonesia memiliki 719 bahasa daerah (http://www.ethnologue.com/country/ ID). Jumlah itu tentu saja merupakan sumber daya yang sangat besar untuk mengembangkan kosa kata bahasa Indonesia. Bahasa Indonesia yang berasal dari bahasa Melayu Riau berkembang pesat dan semakin jauh dari akar bahasanya itu. Jika melihat perkembangan jumlah lema dalam KBBI, peran bahasa daerah cukup signiikan dalam pengayaan KBBI. Jika kita berandai-andai ada satu kata yang bersinonim dalam semua bahasa daerah, satu kata itu dapat menambah 719 lema dalam KBBI. Hal itu tentu tidak perlu dilakukan karena hanya akan menambah sinonim tetapi tidak menambah konsep. Akan tetapi, itu menggambarkan secara konkret potensi bahasa daerah dalam memperkaya kosa kata bahasa Indonesia. Di samping potensi besar itu tersimpan beragam masalah dalam proses penyerapan bahasa daerah menjadi bahasa Indonesia. Beberapa kendala berkaitan dengan hal itu antara lain, perbedaan sistem fonologi dan morfologi. Dalam bahasa Sunda sebagai contoh terdapat gabungan konsonan eu. Sementara, Pedoman Ejaan Bahasa Indonesia menyatakan hanya ada empat gabungan vokal yang disebut diftong, yaitu ai, au, ei, oi. Pedoman itu tentu mengakibatkan kata-kata yang penggunaannya tinggi, seperti keukeuh, sulit untuk menjadi kosa kata bahasa Indonesia. Tulisan ini berupaya untuk menguraikan kendala-kendala yang ada ketika kosa kata bahasa daerah berpotensi menjadi kosa kata bahasa Indonesia. Pembahasan berfokus pada bahasa Sunda. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 129 129 8/2/16 11:19 AM I. PENDAHULUAN Indonesia memiliki 719 bahasa Daerah (http://www.ethnologue.com/country/ID). Jumlah itu tentu saja merupakan sumber daya yang sangat besar untuk mengembangkan kosa kata bahasa Indonesia. Bahasa Indonesia yang berasal dari bahasa Melayu Riau berkembang pesat dan semakin jauh dari akar bahasanya itu. Jika melihat perkembangan jumlah lema dalam KBBI, seharusnya peran bahasa Daerah cukup signiikan dalam pengayaan KBBI. Akan tetapi ternyata dari 90.049 lema dalam KBBI Edisi Keempat (2008) “hanya” 3.592 lema yang berasal dari bahasa Daerah atau lebih kurang 3,99% (Budiwiyono, 2012). Jika kita berandai-andai ada satu kata yang bersinonim dalam semua bahasa Daerah, satu kata itu dapat menambah 719 lema dalam KBBI. Hal itu tentu tidak perlu dilakukan karena hanya akan menambah sinonim tetapi tidak menambah konsep. Akan tetapi, itu menggambarkan secara konkret potensi bahasa Daerah dalam memperkaya kosa kata bahasa Indonesia. Di samping potensi besar itu mungkin tersimpan beragam masalah dalam proses penyerapan bahasa Daerah menjadi bahasa Indonesia. Hal itu mengakibatkan kontribusi bahasa Daerah dalam memperkaya bahasa Indonesia masih kecil. II. BAHASAN Peraturan Pemerintah Republik Indonesia Nomor 57 Tahun 2014 tentang Pengembangan, Pembinaan, dan Pelindungan Bahasa dan Sastra, serta Peningkatan Fungsi Bahasa Indonesia, Pasal 12 ayat 1 mengamanatkan pengembangan bahasa Daerah untuk meningkatkan fungsinya antara lain sebagai sarana pendukung Bahasa Indonesia dan sumber pengembangan Bahasa Indonesia. Beberapa kriteria penyerapan bahasa Daerah adalah kekerapan penggunaan kosakata bahasa daerah oleh wartawan di media massa, kekerapan penggunaan kosakata bahasa daerah oleh penulis atau sastrawan dalam karangannya, kekerapan penggunaan kosakata bahasa daerah oleh tokoh publik, dan ketersediaan konsep baru pada kosakata bahasa daerah yang tidak dimiliki oleh bahasa Indonesia (Budiwiyono, 2012). Sementara itu, bahasa Daerah untuk memadankan istilah asing, harus memenuhi syarat paling tepat dengan konsep termaksud, singkat, berkonotasi baik, eufonik, dan seturut kaidah (Pusat Bahasa, 2008). Beberapa kendala pengayaan kosakata bahasa Indonesia dari bahasa Daerah tentu berkaitan dengan semua faktor itu. Selain itu, kendala berupa perbedaan sistem linguistik antara bahasa Indonesia dan bahasa Daerah. 130 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 130 8/2/16 11:19 AM 2.1 Kendala Fonologis Bahasa Sunda, sebagai contoh, memiliki konsonan: h, n, c, r, k, d, t, s, w, l, p, j, y, ny, m, g, b, ng dan vokal a, i, u, é, o, e, eu. Sementara itu, ada empat bunyi sengau yang dimiliki, yaitu, n, ny, m, dan ng/nga. Bahasa Sunda memiliki vokal eu (Ö). Sementara, Pedoman Ejaan Bahasa Indonesia menyatakan hanya ada empat gabungan vokal yang disebut diftong, yaitu ai, au, ei, oi. Pedoman itu tentu mengakibatkan kata-kata yang penggunaannya cukup tinggi, seperti kadeukeuh, keukeuh sulit untuk menjadi kosa kata bahasa Indonesia. Penyesuaian bisa dilakukan secara fonetis dengan mengubah kadedeh [kad@d@h], kekeh [k@k@h], hanya tentu penutur jati akan mempermasalahkan hal tersebut. 2.3 Kendala Morfologis Beberapa bahasa Daerah memiliki proses nasalisasi dalam pembentukan kata. Pembentukan kata kerja yang paling penting dan paling biasa dalam bahasa Sunda adalah dengan cara nasalisasi (Coolsma, 1983). Proses morfologis itu memberikan aktivitas tertinggi pada sebuah kata yang biasa didapat oleh kata kerja. Pembentukan kata kerja dalam bahasa Sunda dilakukan melalui beberapa pola berikut: 1. nasalisasi, seperti sangu à nyangu ‘menanak nasi’; 2. nasalisasi dan pengimbuhan akhiran –an, seperti baju à ngabajuan ‘memakaikan baju’ ; 3. nasalisasi dan pengimbuhan akhiran –keun, seperti denge à ngadengekeun ‘mendengarkan’ ; 4. pengimbuhan mang- dan –keun meuli à mangmeulikeun ‘membelikan’ ; 5. pengimbuhan nyang-, seperti hareup à nyanghareup ‘menghadap’; 6. pengimbuhan nyang dan -an/-keun; seperti hareup à nyanghareupan ‘menghadapi’; 7. pengimbuhan barang-, seperti gawe à baranggawe ‘bekerja’; 8. pengimbuhan –an, seperti anak à anakan ‘beranak’; 9. pengimbuhan –eun, seperti sidu à sisidueun ‘cegukan’; 10. pengimbuhan pi- dan –eun, seperti untung à piuntungeun ‘mendatangkan keuntungan’; 11. pengulangan konsonan awal dan vokalnya, seperti beresih à beberesih ‘bersihbersih’; 12. pengulangan konsonan awal dan vokalnya, dengan -an atau pengulangan -an, seperti salam à sasalaman ‘bersalaman’; 13. pengimbuhan pa-, seperti pisah à papisah ‘berpisah’; 14. pengimbuhan pa- dgn –an, seperti cengkad à pacengkadan ‘berselisih, perselisihan’; 15. pengimbuhan silih-, seperti banting à silihbanting ‘saling banting’; Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 131 131 8/2/16 11:19 AM 16. 17. 18. 19. pengimbuhan pengimbuhan pengimbuhan pengimbuhan si-, seperti deang à sideang ‘berdiang’; ti-, seperti tajong à titajong ‘tersandung’; -um-, seperti rasa à rumasa ‘merasa’; -in-, seperti tangtu à tinangtu ‘tentu, pasti’; Proses nasalisasi memiliki pola sebagai berikut. Kata-kata yang berhuruf awal konsonan t akan mengalami proses nasalisasi menjadi n, seperti tenjo à nenjo ‘melihat’. Kata-kata yang berhuruf awal konsonan c, j, dan s akan mengalami proses nasalisasi menjadi ny, seperti celuk à nyeluk ‘memanggil’, jieun à nyieun ‘membuat’, dan sawah à nyawah ‘menggarap sawah’. Kata-kata yang berhuruf awal konsonan p akan mengalami proses nasalisasi menjadi m, seperti piceun à miceun ‘membuang’. Katakata yang berhuruf awal selain yang sudah tersebut akan mengalami proses nasalisasi menjadi ng, seperti omong à ngomong ‘berbicara’. Bahasa Indonesia tidak memiliki sistem nasalisasi seperti bahasa Daerah. Kosakata bahasa Daerah yang diserap bahasa Indonesia idealnya hanya kosakata dasar tanpa nasalisasinya. Namun, pada penutur jati bahasa yang diserap timbul anggapan adanya pergeseran konsep atau makna dari kosakata tersebut. Di sisi lain, jika kosakata tersebut dipertahankan dengan nasalisasinya dengan asumsi diserap sebagai satu kata utuh, kosakata bahasa Indonesia akan memiliki banyak kosakata bernasal seperti itu. Sebagai contoh, kata burit dari bahasa Sunda sudah tercatat dalam KBBI Edisi Ketiga. Kata itu sebetulnya tidak perlu dicatat dalam KBBI karena tidak unik dan bersinonim dengan sore, senja, yang unik justru kata turunannya, yaitu ngabuburit. Ketika kata ngabuburit diekstraksi menjadi kata dasar burit kemudian diberi imbuhan me- menjadi memburit untuk konsep ngabuburit jelas terasa “aneh” bahkan bisa ambigu dengan kata yang sama yang memiliki konotasi negatif, yaitu memburit ‘bersetubuh sesama lelaki’. Akhirnya, kata ngabuburit dicatat dalam KBBI IV dengan bentuk dan makna yang sama dengan bahasa sumber, tentu dengan asumsi imbuhan nga- tidak dianggap sebagai imbuhan tetapi dianggap melekat satu kata dengan kata dasarnya. 2.3 Kendala Semantis Bahasa-bahasa Daerah di Indonesia secara linguistik berkerabat karena berasal dari satu rumpun bahasa. kekerabatan itu mewujud dalam beragam hal, seperti fonologi, morfologi, dan semantik. Beberapa kata yang secara semantik bersinonim memiliki bentuk yang berbeda. Beberapa kata yang bentuknya mirip atau sama memiliki makna yang berbeda. Kesinoniman dapat menjadi pemerkaya bahasa Indonesia, meskipun dari sudut pandang perkembangan konsep bahasa, tidak berpengaruh terhadap pemerkayaan konsep. Setakat ini, bahasa Daerah dimanfaatkan untuk memadankan istilah asing dengan syarat antara lain lebih singkat dari pilihan padanan yang tersedia. Secara umum, kriteria lebih singkat ini tentu dapat digunakan untuk memperkaya kosakata umum bahasa Indonesia. 132 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 132 8/2/16 11:19 AM Sebagai contoh, bahasa Indonesia memiliki kosakata cuci tangan, cuci muka, sementara bahasa Sunda memiliki kosakata untuk kedua konsep itu, sibanyo, sibeungeut yang lebih pendek suku katanya. Jadi, kedua kata itu dapat ditawarkan sebagai sinonim, tetapi tentu tidak menambah perbendaharaan konsep bahasa Indonesia. Contoh lain adalah kedua kata yang kerap digunakan oleh pengguna bahasa, yaitu keukeuh dan kadeudeuh. Kekerapan penggunaan kata keukeuh cukup tinggi terutama di kalangan remaja, tetapi kata itu belum berterima dalam bahasa Indonesia karena secara semantis dianggap sama dengan kata kukuh. Sama halnya dengan kata kokoh yang dirujuk silang ke kukuh. Padahal, kata kukuh, kokoh, dan keukeuh yang berkerabat dekat bentuk dan maknanya, bisa saja dimaknai dan digunakan untuk konteks yang berbeda. III. SIMPULAN Bahasa Daerah, secara legal telah diamanatkan sebagai sumber pemerkaya bahasa Indonesia. Namun, perbedaan sistem dalam bahasa Daerah dan Bahasa Indonesia dapat menjadi kendala dalam upaya pemerkayaan bahasa Indonesia yang bersumber dari bahasa Daerah. Oleh karena itu, diperlukan sistem atau pola penyerapan yang lebih sistematis dan menyeluruh untuk “memperlakukan” kosakata-kosakata bahasa Daerah yang layak untuk menjadi warga bahasa Indonesia. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 133 133 8/2/16 11:19 AM Daftar Pustaka Budiwiyanto, Adi. 2012. Kontribusi Kosakata Bahasa Daerah dalam Bahasa Indonesia. http://badanbahasa.kemdikbud.go.id/lamanbahasa/content/kontribusi-kosakata-bahasadaerah-dalam-bahasa-indonesia. Diakses 1 Juli 2016, pukul 8.49. Coolsma, S. 1983. Tata Bahasa Sunda. Jakarta: Djambatan http://www.ethnologue.com/country/ID Peraturan Pemerintah Republik Indonesia Nomor 57 Tahun 2014 tentang Pengembangan, Pembinaan, dan Pelindungan Bahasa dan Sastra, serta Peningkatan Fungsi Bahasa Indonesia. Pusat Bahasa. 2008. Pedoman Umum Pembentukan Istilah Edisi Ketiga. Jakarta: Pusat Bahasa. Pusat Bahasa. 2012. Kamus Besar Bahasa Indonesia Edisi Keempat. Jakarta: PT Gramedia Pustaka Utama. 134 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 134 8/2/16 11:19 AM Evaluasi Kamus Bilingual Kamus Bahasa Daerah Using-Indonesia sebagai Upaya Pemertahanan Eksistensi Bahasa Using di Kabupaten Banyuwangi Fajar Erikha, S.Psi. dan Satwiko Budiono, S.Hum. Departemen Linguistik, Fakultas Ilmu Pengetahuan Budaya, Universitas Indonesia [email protected] dan [email protected] Abstrak Sejak kemunculannya pada tahun 2002, Kamus Bahasa Daerah UsingIndonesia yang dibuat oleh Hasan Ali sudah sulit ditemukan di beberapa wilayah di Banyuwangi. Padahal, pada tahun 2007 Pemerintah Kabupaten Banyuwangi telah menetapkan bahwa muatan lokal untuk jenjang sekolah dasar dan menengah adalah bahasa Using. Hal tersebut seharusnya membuat keberadaan kamus bilingual Using-Indonesia menjadi semakin dibutuhkan masyarakat. Melihat kondisi demikian, sekiranya diperlukannya pembaharuan Kamus Bahasa Daerah Using-Indonesia itu sendiri selain mendistribusikannya kembali ke masyarakat. Maka dari itu, pada penelitian ini akan mencoba melihat kembali struktur dari kamus bilingual itu sendiri dilihat dengan menggunakan kriteria kamus bilingual dari beberapa ahli, seperti Atkins & Rundell (2008) dan Kridalaksana (2003). Evaluasi ini perlu dilakukan karena latar belakang dari pembuat Kamus Bahasa Daerah Using-Indonesia yang merupakan seorang linguis otodidak (Arps, 2010: 237) sehingga bisa saja ada beberapa kriteria kamus bilingual yang masih belum terpenuhi dari kriteria kamus bilingual secara teori linguistik. Selain itu, struktur Kamus Bahasa Daerah Using-Indonesia juga akan dibandingkan dengan kriteria kamus bilingual dari Summer Institute of Linguistics International (SIL International) dalam buku Making Dictionaries (2000). Tentu saja, manfaat dari penelitian ini adalah dapat menjadi bahan evaluasi untuk membuat Kamus Bahasa Daerah Using-Indonesia yang baru dengan disesuaikan pada kegunaannya di masyarakat. Kata kunci: evaluasi, struktur, leksikograi, kamus bilingual, dan Kamus Bahasa Daerah Using-Indonesia. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 135 135 8/2/16 11:19 AM I. PENDAHULUAN Kamus Bahasa Daerah Using-Indonesia (2002) mempunyai peranan penting di Kabupaten Banyuwangi mulai sejak awal kemunculannya yang ditulis oleh Hasan Ali. Selain sebagai salah satu hasil kodiikasi dari bahasa Using sendiri, kamus bilingual tersebut mempunyai andil dalam menyebarluaskan bahasa Using di Kabupaten Banyuwangi. Pasalnya, tidak semua masyarakat yang tinggal di Kabupaten Banyuwangi merupakan masyarakat Using. Dalam buku Geograi Dialek Banyuwangi, Soetoko (1981) mengungkapkan bahwa masyarakat yang tinggal di Kabupaten Banyuwangi sangat beragam. Misalnya, dari suku Jawa, Bali, Bugis, dan Madura. Terlebih lagi, Pemerintah Kabupaten Banyuwangi (2007) menetapkan bahwa muatan lokal untuk jenjang sekolah dasar dan menengah adalah bahasa Using. Ini senada dengan temuan Lew (2016) yang menyatakan bahwa kamus merupakan alat yang belajar menulis dan belajar berbahasa kedua yang efektif. Hal tersebut membuat keberadaan Kamus Bahasa Daerah Using-Indonesia semakin dibutuhkan masyarakat untuk dapat mempelajari bahasa Using. Namun, kondisi di lapangan justru memperlihatkan hal yang sebaliknya. Kamus Bahasa Daerah Using-Indonesia sekarang ini sudah susah dicari di toko buku manapun di Kabupaten Banyuwangi. Kamus bilingual tersebut sudah tidak dicetak kembali. Dapat dikatakan di sini, sangat sedikit masyarakat yang mempunyai kamus bilingual tersebut. Padahal, masyarakat sangat membutuhkan Kamus Bahasa Daerah Using-Indonesia untuk menjadi dasar acuan mengenal bahasa Using. Kondisi demikian membuat diperlukannya pendistribusian kembali kamus bilingual Using-Indonesia ke masyarakat di Kabupaten Banyuwangi dengan adanya evaluasi dalam hal strukturnya. Evaluasi kamus ini dirasa penting selain karena memang tahun terbitan dari Kamus Bahasa Daerah Using-Indonesia yang sudah lama sejak tahun 2002, alasan lain harus adanya evaluasi disebabkan penyusun kamus bilingual ini merupakan seorang linguis otodidak (Arps, 010: 237). Hal tersebut sekiranya sedikit bertentangan dengan persyaratan kemampuan penyusun kamus yang diungkapkan oleh Kridalaksana dalam buku yang berjudul Rintisan Kajian Leksikologi dan Leksikograi. Dalam hal ini, Kridalaksana (2003: xii) menyebutkan bahwa ada beberapa persyaratan kemampuan penyusun kamus. Salah satu persyaratan kemampuan penyusun kamus tersebut adalah kemampuan linguistik yang memadai sesuai tingkat tanggung jawab dalam program dan bidang yang akan disajikan. Dengan kata lain, sebuah kamus idealnya dibuat oleh seorang linguis terlatih yang memiliki kepekaan bahasa yang baik. Selain itu, pembuatan kamus ini juga harus didasarkan melalui penataran untuk melatih para penyusun kamus mulai dari penelitian leksikologi dan leksikograi yang mencakup dari korpus yang ada sampai ke pemeriksaan naskah akhir. Dengan begitu, Hasan Ali selaku pembuat kamus bilingual Using-Indonesia dirasa belum memenuhi persyaratan kemampuan pembuat kamus yang memadai karena ia tergolong linguis otodidak sehingga perlu dilakukan evaluasi yang didasarkan pada kriteria kamus bilingual berdasarkan teori leksikologi dan leksikograi. 136 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 136 8/2/16 11:19 AM Sehubungan dengan hal tersebut, penulis ingin melakukan evaluasi Kamus Bahasa Daerah Using-Indonesia yang disesuaikan atau dicocokkan dengan kriteria kamus bilingual menurut beberapa ahli lingustik. Beberapa ahli tersebut adalah Atkins & Rundell (2008) dalam buku The Oxford Guide to Practical Lexicography dan Kridalaksana (2003) dalam buku Rintisan Kajian Leksikologi dan Leksikograi. Tidak hanya itu, pada tulisan ini pun evaluasi akan dilihat berdasarkan kriteria kamus bilingual dari SIL Internasional dalam buku Making Dictionaries (2000). Pendekatan kriteria kamus bilingual didasarkan oleh ketiga sumber yang telah dijelaskan untuk membuat evaluasi kamus semakin komprehensif dan menyeluruh. Adanya evaluasi ini dapat menjadi pijakan awal atau bahan referensi jika Kamus Bahasa Daerah Using-Indonesia akan direvisi dan disebarluaskan kembali ke masyarakat di Kabupaten Banyuwangi. Evaluasi tersebut juga dimaksudkan agar masyarakat dipermudah saat mempelajari dan menggunakan kamus bilingual ini. Selain itu, kebutuhan akan evaluasi kamus ini disebabkan oleh adanya beberapa kendala dalam menggunakan sebuah atau beberapa kamus. Salah satu kendala yang sering dihadapi adalah seringkali isi kamus dibentuk hanya sebatas pertimbangan para leksikografernya. Beberapa keputusan yang dibuat para leksikografer ini rawan mengarah kepada subjektivitas penyusun kamus (Lauder, 2010: 222). Bahkan, Piotrowski (1994) membedakan pembuat kamus karya linguis dan karya bukan linguis. Menurutnya, kamus karya bukan linguis cenderung superisial dan berisikan sejumlah data dengan cakupan yang luas, sedangkan kamus karya linguis cenderung meneliti dalam cakupan yang terbatas, lebih intensif, dan telaah kasus secara mendalam. Dari hal tersebut, dapat dikatakan bahwa kamus dari bukan linguis kurang mendalam seperti kamus karya linguis. Tentu saja, hal tersebut disebabkan pembuat kamus yang bukan linguis ingin memasukkan semua hal yang dirasa perlu sebagai bagian dari pendokumentasian bahasa. Namun, hal tersebut membuat kamus menjadi tidak mendalam dan kurang spesiik. Maka dari itu, pada tulisan ini dapat dirumuskan permasalahan penelitian berupa bagaimana evaluasi kamus bilingual Using-Indonesia sebagai upaya pemertahanan eksistensi bahasa Using di Kabupaten Banyuwangi dengan menggunakan pendekatan kriteria pembuatan kamus dari teori leksikograi yang ada dan apa saja masukan yang dapat dijadikan bahan referensi jika Kamus Bahasa Using-Indonesia akan direvisi di kemudian hari. Hal tersebut membuat penelitian ini bertujuan untuk mengidentiikasi komposisi standar kamus bilingual sesuai teori leksikograi dengan Kamus Bahasa UsingIndonesia. Selain itu, penelitian ini juga dapat menjelaskan kekuatan dan kelemahan yang terdapat pada kamus bilingual Using-Indonesia yang dibuat oleh linguis otodidak. II. KERANGKA TEORI DAN METODE PENELITIAN Jika dilihat berdasarkan jenis kamus, Kamus Bahasa Using-Indonesia tergolong ke dalam kamus dwibahasa atau kamus bilingual. Kamus bilingual adalah kamus yang berisi lema-lema dari dua bahasa berbeda namun memiliki makna yang setara satu sama Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 137 137 8/2/16 11:19 AM lainnya, lengkap dengan konteks yang melingkupinya (Coward & Grimes, 2000: 70). Kamus bilingual juga merupakan produk leksikograi dasar selain jenis-jenis kamus yang lain (Piotrowski, 1994). Pada dasarnya, kamus bilingual digunakan bagi pemelajar bahasa kedua. Oleh karena itu, kamus jenis ini dibuat sesederhana mungkin dan mudah digunakan. Selain itu, Humblé (2001) juga memaparkan bahwa kamus bilingual harus dibuat lebih lengkap dengan menyertakan deinisi yang komprehensif dari masing-masing lema yang dipaparkan. Hal tersebut menandakan kamus ini tidak hanya ditujukan kepada pemelajar bahasa kedua saja tetapi juga pengguna bahasa pertama. Berkaitan dengan hal tersebut, Kamus Daerah Using-Indonesia juga sekiranya sesuai dengan pendapat Humblé bahwa kamus bilingual ini tidak hanya ditujukan kepada pemelajar bahasa kedua saja tetapi juga untuk pengguna bahasa pertama. Untuk itu, diperlukan pemahaman mengenai kriteria pembuatan kamus bilingual supaya masyarakat mudah menggunakan dan isi kamus sesuai dengan kebutuhannya. Kriteria pembuatan kamus bilingual sendiri dipaparkan oleh beberapa ahli. Misalnya, Atkins & Rundell (2008) dan Kridalaksana (2003). Selain itu, kriteria pembuatan kamus bilingual berdasarkan pedoman SIL Internasional juga akan dilihat agar evaluasi sekiranya lebih komprehensif dan menyeluruh. Menurut Atkins & Rundell (2008: 176), bagian dari kamus dibedakan menjadi dua, yaitu materi depan dan belakang kamus serta konten dari penyusunan lema. Pertama, hal yang dimaksud dengan materi depan dan belakang kamus lebih mengarah kepada bagian di luar lema. Lebih spesiik lagi, hal ini berkaitan dengan materi apa saja yang harus ada di dalam kamus selain daftar kosakata atau lemanya. Sebenarnya masalah konten depan dan belakang kamus ini harus disesuaikan dengan kebutuhan dan sasaran kamus terlebih dahulu. Ini disebabkan kebutuhan yang berbeda sehingga membuat dan sasaran berbeda pula pada konten depan dan belakang kamus. Lebih lanjut, Atkins & Rundell menjelaskan bahwa secara umum konten depan kamus memuat kata pengantar, ucapan terima kasih, penjelasan singkatan, label, dan kode yang digunakan dalam kamus. Selain itu, dapat pula ditambahkan penjelasan mengenai sejarah bahasa yang tentu saja harus disesuaikan dengan kebutuhan dan sasaran kamus. Tidak hanya itu, bagaimana cara menggunakan kamus atau petunjuk kamus juga harus ada di bagian depan kamus. Dalam hal ini, petunjuk kamus merupakan bagian yang paling penting untuk dapat mengarahkan pengguna supaya dapat memahami isi dari kamus. Petunjuk penggunaan kamus ini juga sekiranya harus memuat penjelasan terkait struktur lema sehingga pengguna dapat dengan jelas mengetahui nama dan komponen apa yang ada di dalam lema. Berikut contoh yang diberikan Atkins & Rundell (2008: 177). Sementara itu, untuk bagian belakang kamus materi yang disarankan ada pada kamus secara umum adalah tabel kata, angka, berat, langkah-langkah, unsur kimia, angka romawi, dan pedoman umum ejaan bahasa tersebut. Selain itu, informasi tambahan, seperti variasi regional, peta dialek bahasa, dan menyediakan alat bantu belajar yang berguna sebagai panduan. Semua hal tersebut dirasa Atkins & Rundell sebagai pelengkap dan membuat keutuhan kamus. 138 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 138 8/2/16 11:19 AM Gambar 1. Contoh penjelasan konten lema pada bagian petunjuk kamus Selanjutnya, pada konten penyusunan lema Atkins & Rundell (2008: 491) mengungkapkan bahwa konten lema memiliki beberapa gaya yang bisa diikuti. Salah satu gaya penulisan konten lema ini seharusnya disesuaikan lagi dengan kebutuhan dan sasaran sehingga pengguna tidak susah atau bingung ketika melihat kamusnya. Dalam hal ini, ada lima konten multiword expressions (MWEs) pada lema. Kelima konten MWE pada lema tersebut adalah idiom, kolokasi, kata majemuk, frase verba, dan kontruksi pendukung verba. Berikut contoh dua gaya penulisan konten lema berdasarkan kamus Inggris-Perancis yang berbeda seperti yang tertera di bawah ini. Gambar 2. Contoh gaya konten MWE dari dua kamus yang berbeda Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 139 139 8/2/16 11:19 AM Berdasarkan gambar di atas dapat terlihat bahwa terdapat perbedaan konten lema pada dua kamus yang berbeda. Perbedaan lebih kepada frasa verba, kontruksi pembantu verba, dan lambang kolokasinya. Untuk perbedaan frasa verba, antara OHFD-3 dan CRFD-8 hanya terletak pada penyusunan atau formatnya saja. Pada OHFD-3, format yang digunakan untuk frasa verba melebur menjadi satu dalam satu paragraf dan kata entri depannya tidak dituliskan kembali. Hal tersebut berbeda dengan CRFD-8 yang menampilkan frasa verba dengan disusun ke bawah lengkap dengan kata entri depannya. Kemudian pada kontruksi pembantu verba perbedaan terletak dari ada tidaknya contoh kalimat. Hanya CRFD-8 yang mempunyai contoh kalimat. Selain itu, lambang kolokasinya pun berbeda. Lambang kolokasi pada OHFD-3 menggunakan huruf, sedangkan kolokasi pada CRFD-8 menggunakan angka. Di pihak lain, Kridalaksana (2003: xii) menggolongkan kriteria kamus, baik kamus monolingual dan kamus bilingual, menjadi dua bagian. Bagian tersebut dibagi atas mikrostruktur dan makrostruktur. Mikrotruktur menyangkut susunan informasi dalam entri kamus dan semua informasi berupa format dan perincian entri tergantung pada pengguna yang dituju. Mikrostruktur meliputi lema (kata kepala), deinisi dalam kamus, kelas kata, dan sublema dengan informasinya. Misalnya, derivasi, inleksi, lafal, variasi historis, sosial dan geograis, gaya bahasa, konteks penggunaan bahasa, sinonim dan antonym, serta etimologi yang ditandai dengan label singkatan atau lambang. Sementara itu, makrostruktur bersangkutan dengan susunan entri dalam kamus. Makrostruktur juga meliputi susunan abjad, rujuk silang, kata majemuk, gabungan leksem, tipograis, gambar atau diagram sebagai ilustrasi, dan petunjuk penggunaan kamus, sejarah bahasa, daftar nama negara di dunia, dan informasi lain yang dianggap perlu oleh pengguna. Perihal ilustrasi pun merupakan hal penting untuk mempermudah pengguna (Granger & Lefer, 2016) Tidak hanya itu, kriteria kamus bilingual juga terdapat pada pedoman pembuatan kamus dari SIL International. Pada buku Making Dictionaries (2000) yang diterbitkan oleh SIL International, kriteria kamus bilingual juga meliputi isi dan luar isi. Maksud dari isi adalah informasi struktur dalam entri leksikal, sedangkan luar isi adalah bagian selain lema seperti pengantar kamus. Coward & Grimes (2000: 178) mengungkapkan bahwa pengantar kamus harus dibuat untuk mengelaborasi informasi yang ada di dalam kamus sehingga pengguna dapat dengan mudah menggunakan kamus tersebut. Lebih spesiik lagi, Coward & Grimes memberikan beberapa aspek yang sekiranya harus ada atau disarankan ada pada bagian pengantar kamus seperti daftar di bawah ini: 1. Identiikasi sasaran dan tujuan penggunaan kamus. Selain itu, disarankan pula untuk memberikan keseluruhan informasi kamus. Misalnya, memberikan urutan alfabet, memberikan jumlah entri kamus, dan sebagainya. 2. Memberikan keterangan singkat terkait lokasi bahasa, jumlah populasi etnis kelompok, jumlah penutur bahasa, dan konteks regional bahasa tersebut berada. 140 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 140 8/2/16 11:19 AM 3. Memberikan penjelasan peristiwa sejarah, seperti perang, migrasi, maupun hal-hal yang dianggap perlu untuk menjelaskan perubahan atau variasi bahasa sehingga pembaca tidak salah menafsirkan informasi yang terdapat dalam kamus. 4. Memberikan ulasan singkat tentang nama bahasa atau nama alternatifnya. 5. Menyebutkan klasiikasi linguistik, seperti hubungan kekerabatan bahasa, induk bahasa, dan sebagainya. 6. Daftar sejumlah karya bahasa yang telah dipublikasikan sebelumnya 7. Menyediakan proil sosiolinguistik singkat, termasuk dialek, register sosial, pola bicara berdasarkan gender, pendidikan, atau apapun yang akan membantu pengguna kamus. 8. Menyediakan peta dalam konteks regional dan peta dialek untuk membantu pengguna kamus memahami informasi variasi dialek. 9. Memberikan gambaran singkat fonologi, panduan untuk pengucapan, dan panduan untuk ortograi yang digunakan dalam kamus. 10. Memberikan gambaran singkat dari tata bahasa. 11. Memberikan sketsa etnografi singkat untuk membantu pengguna kamus menafsirkan masukan pada pada kamus. 12. Memberikan panduan untuk label dan singkatan yang digunakan dalam kamus. 13. Memberikan penjelasan cara membaca entri kamus 14. Menyediakan bagian yang menjelaskan bagaimana menggunakan rujukan silang 15. Menyediakan bibliograi semua referensi yang dikenal mulai dari segi bahasa, budaya, dan sejarah yang digunakan pada kamus. Di sisi lain, Coward & Grimes (2000: 99) menyebutkan pula bahwa dalam membuat kamus ada beberapa struktur informasi dalam entri leksikal yang harus ada atau terpenuhi. Beberapa struktur informasi dalam entri leksikal yang harus ada pada sebuah kamus adalah prinsip pemilihan lema atau kata kepala, pemilihan contoh kalimat, pemisahan perbedaan kata dan perbedaan makna, kategori semantik, dan informasi dialek. Pemilihan lema atau kata kepala ini didasarkan pada akar kata dan aiks yang mengikutinya. Pemilihan contoh kalimat harus ada pada setiap makna kata sehingga pengguna kamus dapat mengetahui konteks dari kata tersebut. Pemisahan perbedaan kata dan perbedaan makna berdasarkan homonimi dan polisemi ini penting untuk menggambarkan situasi kebahasaan pada kamus sehingga pengguna tidak akan salah bila mengkaitkannya dengan konteks yang ada di masyarakat. Kategori semantik pun perlu untuk ditinjau lebih lanjut untuk dapat mengkategorikan kata menjadi sebuah lema dan informasi dialek dapat dimaksudkan untuk mengetahui asal dialek dari lema yang ada sehingga pengguna kamus akan mengetahui sumber dari entri leksikal tersebut tergolong ke dalam dialek yang mana jika bahasa tersebut mempunyai banyak dialek. Dari segi metode penelitian, metode pemerolehan data didapat dari Kamus UsingIndonesia (2002). Data ini diambil karena penulis menduga belum ada penelitian sejenis sebelumnya. Penulis juga berharap bahwa dengan menggunakan data ini akan dapat Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 141 141 8/2/16 11:19 AM memberikan kontribusi dalam mengangkat salah satu hasil kodiikasi bahasa Using itu sendiri. Data ini pun diambil karena melihat keadaan kamus bilingual ini sudah sulit ditemukan. Sementara itu, metode penelitian yang digunakan pada penelitian ini adalah metode kualitatif. Metode kualitatif adalah metode yang berhubungan dengan ide, persepsi, pendapat, atau kepercayaan orang yang diteliti. Semuanya tidak dapat diukur dengan angka (Basuki, 2006: 78). Jadi, dalam tulisan ini data diolah menurut interpretasi penulis tanpa adanya penghitungan yang bersifat angka. Tulisan ini juga lebih kepada penelitian korpus data dari kepustakaan dan bukan penelitian lapangan. Langkah pertama yang dilakukan dalam penelitian ini adalah melihat keseluruhan Kamus Bahasa Daerah Using-Indonesia untuk menentukan topik apa yang akan dibahas. Setelah mendapatkan topik atas bahasan yang akan digunakan pada penelitian ini, penulis mencari teori yang relevan terkait dengan topik yang ditemukan sebelumnya. Dalam hal ini, topik yang akan diangkat penulis lebih cenderung mengarah pada kriteria kamus bilingual. Hal ini disebabkan setelah melihat dengan kamus bilingual yang lain terdapat perbedaan konten maupun isi kamus sehingga menarik rasa penasaran penulis akan komposisi standar kamus bilingual itu sendiri dari berbagai sumber yang kompeten di ranah perkamusan. Berikutnya, melakukan identiikasi atas kriteria kamus bilingual dari Atkins & Rundell (2008), Kridalaksana (2003), dan Coward & Grimes (2000). Dari identiikasi tersebut nantinya diketahui kekuatan dan kelemahan atau aspek yang sudah terpenuhi dan belum terpenuhi dalam Kamus Bahasa Daerah Using-Indonesia sehingga dapat memberikan masukan konten atau isi apa saja yang harus ditambah dan dipertahankan jika kamus bilingual ini akan direvisi serta disebarluaskan kembali ke masyarakat di Kabupaten Banyuwangi. III. ANALISIS PENELITIAN Seperti penjelasan pada kerangka teori, analisis penelitian ini didasarkan pada kriteria kamus bilingual Atkins & Rundell (2008), Kridalaksana (2003), dan Coward & Grimes (2000). Secara umum ketiganya memiliki criteria yang relatif sama. Hanya saja perbedaan di antara ketiganya dalam hal perincian dan penyebutan istilah-istilah saja. Oleh karena itu kriteria dari masing-masing ahli akan disandingkan dengan konten pada Kamus Bahasa Daerah Using-Indonesia. Berdasarkan penyandingan tersebut diharapkan akan menampilkan kriteria mana saja yang sudah terpenuhi dan kriteria mana yang belum terpenuhi. Hasilnya akan dijadikan sebagai bahan pertimbangan saat melakukan perevisian kamus di kemudian hari. Untuk mengawali bagian analisis, kriteria kamus bilingual Coward & Grimes (2000) akan dipaparkan terlebih dahulu. Dalam hal ini, Coward & Grimes membagi kriteria kamus bilingual menjadi dua bagian. Bagian pertama adalah kriteria pengantar kamus, sedangkan bagian kedua adalah kriteria isi kamus. Berikut ini perbandingan kriteria pengantar kamus yang ditetapkan dengan kriteria pada Kamus Bahasa Daerah Using-Indonesia. 142 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 142 8/2/16 11:19 AM No 1 2 3 4 Kriteria Pengantar Kamus Tujuan, sasaran penggunaan, dan gambaran penyusunan kamus (misalnya urutan lema disusun berdasarkan alfabetis) Keterangan bahasa: lokasi pemakaian, jumlah populasi, etnis pemakai, jumlah penutur, dan konteks regional daerah penutur Peristiwa bersejarah yang melatari perkembangan bahasa: ditafsirkan melalui simbol \et (etimologi) dan \bw borrowed word atau kata pinjaman) Ulasan singkat tentang penamaan bahasa atau nama alternatif bahasa tersebut, jika memang isu ini dianggap relevan Kamus Bahasa Using-Indonesia Ketersediaan Keterangan ✔ Kecuali jumlah entri kamus. ✔ Lokasi ada, pemakaian oleh siapa ada, etnis ada, jumlah penutur tidak, konteks regional ada ✔ Etimologi diberi dalam bentuk label nama Bahasa asalnya. Misal:A (Arab), JK (Jawa Kuna), S (Sanskerta) ✔ Penjelasan dicantumkan melalui kata pengantar oleh Perwakilan Kabupaten Banyuwangi 5 Klasiikasi linguistik: diperdebatkan atau tidak — 6 Daftar sejumlah karya bahasa yang telah dipublikasikan sebelumnya ✔ Tidak ada penjelasan. Padahal terdapat penjelasan linguistik lain yang menyatakan bahwa bahasa Using bukan bahasa tetapi bentuk dialek bahasa Jawa Kuna (Budiono, 2015) Terdapat beberapa karya seperti disertasi Bahasa Using di Kabupaten Banyuwangi (1987), karya sastra Sri Tanjung dalam Ensiklopedia Indonesia (1987), dan Kalangwan (1985) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 143 143 8/2/16 11:19 AM 7 8 9 10 11 12 144 Proil sosiolinguistik singkat, termasuk aneka dialek, daftar kelompok masyarakat, daftar leksikal yang tabu, pola tuturan yang berbeda pada lintas gender/usia, ragam tuturan penutur yang berpendidikan. Misalnya: \us (usage atau penggunaan), \va (varian), \oe (restrictions), \lf SynD (sinonim dialektal), \lf SynR (sinonim register), \ lf SynT (sinonim tabu), dan \lf SynL (sinonim pinjaman yang sudah berasimilasi) Peta persebaran bahasa dan dialek Bagan fonologi singkat, panduan pelafalan, dan panduan ortograi berikut dengan sejumlah contoh sederhana Gambaran tata bahasa singkat Gambaran singkat etnograis. Misalnya: struktur sosial, budaya material, ekonomi, agrikultur, dan kosmologi. Pencantuman label-label dan singkatan — Tidak ada penjelasan — Tidak ada penjelasan ✔ Seluruhnya dimuat secara lengkap dan ringkas pada kamus ini — Tata bahasa tidak ada. Namun, dalam pustaka acuan “Pedoman Umum Ejaan Bahasa Using” tertera informasi acuan dari Tata Bahasa Baku Bahasa Using (Hasan Ali, 1990) yang belum pernah diterbitkan — Tidak ada penjelasan ✔ Terdapat informasi seperti perbedaan representasi huruf Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 144 8/2/16 11:19 AM 13 14 15 Pencantuman cara membaca entri kamus. Misalnya: informasi apa yang dipaparkan pertama kali, perbedaan representasi huruf (huruf tebal, miring, dll), makna hierarki dari entri, penandaan homonim, dll). Pencantuman bagaimana menggunakan rujukan silang (reversed inderlist) Bibliograi seluruh informasi yang termaktub di kamus ✔ Terdapat informasi seperti perbedaan representasi huruf ✔ Terdapat penjelasan (pada hal x) ✔ Terdapat bibliograi Tabel 1. Perbandingan Kamus Bahasa Daerah Using-Indonesia dengan Kriteria Pengantar Isi Kamus (Coward & Grimes, 2000) Tabel di atas menunjukkan bahwa kriteria pengantar kamus yang sudah terpenuhi dari Kamus Bahasa Daerah Using-Indonesia yaitu urutan alfabetis, identiikasi sasaran & tujuan kamus, keterangan bahasa, penjelasan sejarah bahasa, panduan pengucapan, panduan label & singkatan, dan bibliograi. Semua hal tersebut ada pada Kamus Bahasa Daerah Using-Indonesia walaupun tidak secara khusus dijelaskan. Maksudnya, kriteria seperti urutan alfabetis, panduan pengucapan dan panduan label & singkatan dalam Kamus Bahasa Daerah Using-Indonesia termasuk ke dalam atau berada di bagian petunjuk penggunaan kamus sebelum bagian daftar lema. Hal yang sama juga diperlihatkan pada identiikasi sasaran & tujuan, keterangan bahasa, dan penjelasan sejarah bahasa. Ketiga hal itu berada dalam satu bagian, yaitu bagian pengantar. Selain itu, identiikasi sasaran & tujuan, dan keterangan bahasa juga terdapat pada bagian kata sambutan kepala pusat bahasa dan sambutan Bupati Banyuwangi. Tidak lupa, bibliograi pun dicantumkan pada Kamus Bahasa Daerah Using-Indonesia setelah daftar lema. Di sisi lain, kriteria yang belum terpenuhi adalah informasi jumlah entri kamus, proil sosiolinguistik, peta dialek, sketsa etnograi, penjelasan cara baca entri, dan petunjuk rujuk silang. Jumlah entri kamus ini penting sebagai informasi dasar kamus sehingga dapat memudahkan proses revisi. Sebenarnya jumlah entri kamus cukup disebutkan bersama kata pengantar layaknya informasi keterangan bahasa dan penjelasan sejarah bahasa yang sudah ada dalam kamus. Kemudian, proil sosiolinguistik, peta dialek, dan sketsa etnograi pun seharusnya dicantumkan pada Kamus Bahasa Daerah Using-Indonesia supaya pengguna mendapatkan gambaran terkait kondisi kebahasaan dan kondisi geograis bahasa Using. Sebagai perbandingan, aspek ini sudah ada pada kamus bilingual Kamus Pengantar Bahasa Pantar Barat (Holton, 2008). Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 145 145 8/2/16 11:19 AM Hal lain yang sudah ada tetapi kurang diperjelas pada Kamus Bahasa Daerah Using-Indonesia, sesuai dengan kriteria pengantar kamus dari Coward & Grimes adalah penjelasan cara membaca entri dan petunjuk rujuk silang. Pada kamus ini penjelasan mengenai hal-hal yang ada pada bagian entri sudah dijelaskan pada bagian petunjuk penggunaan kamus. Akan tetapi, jika didasarkan pada tujuan kamus yang penggunanya semua kalangan, baik linguis maupun bukan linguis, hal tersebut belum cukup menjelaskan apa maksud dari hal-hal yang ada pada lema. Tidak ada penjelasan yang dapat memudahkan masyarakat umum, terutama mereka yang tidak menggeluti bidang linguistik secara khusus. Seharusnya ada penjelasan cara membaca entri seperti contoh penjelasan konten lema pada bagian petunjuk kamus yang telah diterangkan Atkins & Rundell (2008), pada bagian kerangka teori. Kondisi serupa juga terdapat pada kriteria petunjuk rujuk silang. Pada Kamus Bahasa Daerah Using-Indonesia, informasi rujuk silang sudah dimuat untuk mengarahkan pengguna kamus ke daftar entri lema yang benar. Namun sayangnya, petunjuk rujuk silang ini tidak dibuat secara khusus sehingga dapat memudahkan pengguna kamus agar tidak kesulitan. No 146 Kriteria Isi Kamus 1 Lema 2 Contoh Kalimat 3 Perbedaan Kata 4 Homonimi vs Polisemi 5 Perbedaan Makna Kamus Bahasa Using-Indonesia Ketersediaan Keterangan Kecuali jumlah entri kamus. ✔ Lokasi ada, pemakaian oleh siapa ada, etnis ada, jumlah — penutur tidak, konteks regional ada Etimologi diberi dalam bentuk label nama Bahasa asalnya. — Misal:A (Arab), JK (Jawa Kuna), S (Sanskerta) Penjelasan dicantumkan melalui — kata pengantar oleh Perwakilan Kabupaten Banyuwangi Tidak ada penjelasan. Padahal terdapat penjelasan linguistik lain yang menyatakan bahwa ✔ bahasa Using bukan bahasa tetapi bentuk dialek bahasa Jawa Kuna (Budiono, 2015) Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 146 8/2/16 11:19 AM 6 Informasi Dialek — Terdapat beberapa karya seperti disertasi Bahasa Using di Kabupaten Banyuwangi (1987), karya sastra Sri Tanjung dalam Ensiklopedia Indonesia (1987), dan Kalangwan (1985) Tabel 2. Perbandingan Kamus Using-Indonesia dengan Kriteria Isi Kamus (Coward & Grimes, 2000) Dengan melihat kriteria isi kamus di atas, dapat diketahui bahwa kriteria isi Kamus Bahasa Daerah Using-Indonesia sebagian besar belum terpenuhi. Ini dibuktikan dengan hanya kriteria lema dan perbedaan makna saja yang terdapat pada Kamus Bahasa Daerah Using-Indonesia. Meskipun demikian, perbedaan makna tersebut juga belum konsisten ada pada seluruh lema atau mungkin saja memang hanya beberapa saja yang memiliki perbedaan makna. Ketidakkonsistenan juga terdapat pada kriteria contoh kalimat dan aiksasi. Sebenarnya, kedua kriteria tersebut sudah ada pada Kamus Bahasa UsingIndonesia. Akan tetapi, frekuensi kemunculannya yang sedikit atau inkonsisten pada seluruh lema sehingga penulis menggolongkan kedua kriteria ini belum terpenuhi dan menjadi bahan pertimbangan untuk revisi kamus di kemudian hari. Selain itu, perbedaan kata dan informasi dialek juga belum ada. Informasi dialek merupakan hal penting untuk mengenali variasi dari bahasa Using di Kabupaten Banyuwangi mengingat kabupaten ini tergolong luas dibandingkan daerah lainnya di sekitarnya. Selanjutnya, struktur dan konten pada Kamus Bahasa Daerah Using-Indonesia akan dicocokkan dengan kriteria kamus bilingual dari Kridalaksana (2003). Dalam hal ini, Kridalaksana menerangkan bahwa kamus memiliki bagian makrostruktur dan mikrostruktur. Di bawah ini akan ditampilkan terlebih dahulu tabel perbandingan Kamus Bahasa Using-Indonesia dengan kriteria makrostruktur. No Kriteria Makrostruktur 1 Susunan Abjad 2 Rujuk Silang 3 Kata Majemuk 4 Gabungan Leksem Kamus Bahasa Using-Indonesia Ketersediaan Keterangan Terdapat informasi susunan abjad pada awal petunjuk ✔ penggunaan kamus Dicantumkan di bawah tanda ✔ baca Dicantumkan dengan jelas pada Pedoman Umum Ejaan Bahasa ✔ Using, lampiran kamus — Tidak ada penjelasan Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 147 147 8/2/16 11:19 AM 5 6 Tipograis Petunjuk Penggunaan ✔ ✔ 7 Sejarah Bahasa ✔ 8 Daftar Nama Negara — Pencantuman penggunaan huruh tegak dan hurung miring pada Petunjuk Penggunaan Kamus; Pencantuman penggunaan huruf tebal dan miring pada Pedoman Umum Ejaan Bahasa Using Mencakup informasi susunan abjad, rujuk silang, dan tipograis, Terdapat informasi sejarah bahasa dan sastra yang sangat singkat; bersifat pengenalan semata Tidak ada penjelasan Tabel 3. Perbandingan Kamus Using-Indonesia dengan Kriteria Makrostruktur (Kridalaksana, 2003) Bila dicocokkan dengan kriteria makrostruktur Kridalaksana (2003), Kamus Bahasa Daerah Using-Indonesia ini sudah ada yang sesuai dan ada pula yang belum. Kriteria makrostruktur yang sudah sesuai adalah susunan abjad, kata majemuk, rujuk silang, tipograis, petunjuk penggunaan kamus, dan sejarah bahasa. Berbeda dari criteria Coward & Grimes (2000), Kridalaksana tidak menyebutkan petunjuk rujuk silang secara spesiik sehingga dapat diartikan bahwa hanya muatan rujuk silang saja yang harus ada. Kemudian, susunan abjad dan tipograis melebur menjadi satu pada bagian petunjuk penggunaan kamus. Meskipun Kridalaksana membedakan susunan abjad, tipograis, dan petunjuk penggunaan kamus, tetapi pada Kamus Bahasa Daerah Using-Indonesia tidak membedakannya menjadi bagian yang berdiri sendiri pada satu bagian. Di samping itu, kriteria makrostruktur yang belum sesuai adalah belum adanya kata majemuk, gabungan leksem, dan daftar nama negara. Untuk kata majemuk dan gabungan leksem perlu ditelusuri terlebih dahulu apakah pada bahasa Using memiliki kedua kriteria tersebut atau tidak. Jika memang ada, seharusnya kata majemuk dan gabungan leksem harus dimasukkan untuk menambah entri leksikal dan wawasan pembaca tentang khazanah bahasa Using. Kemudian, pada daftar nama negara yang belum ada pada kamus dirasa penulis wajar dan belum terlalu mendesak untuk dimasukkan mengingat kamus ini merupakan kamus bahasa daerah. Mungkin saja, jika nanti akan ada revisi sebaiknya memasukkan daftar nama daerah yang ada di Indonesia. Selain turut melakukan penginventarisasian daerah, memasukkan daftar nama daerah di Indonesia juga akan menjadi inovasi yang baru pada dunia perkamusan, khususnya kamus bahasa daerah jika memang ada penyebutan nama daerah yang berbeda bila disesuaikan dengan struktur bahasa Using. 148 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 148 8/2/16 11:19 AM Setelah melihat perbandingan kriteria makrostruktur kamus bilingual dari Kridalaksana dengan Kamus Bahasa Daerah Using-Indonesia, tidak lengkap rasanya bila tidak melihat pula perbandingan mikrostruktur kamus bilingualnya. Hal ini diharapkan akan dapat membuat pemahaman akan struktur kamus menjadi lebih lengkap atau komprehensif. Berikut di bawah ini kriteria mikrostruktur yang dibandingkan dengan Kamus Bahasa Daerah Using-Indonesia. No Kriteria Makrostruktur 1 Deinisi 2 Kelas Kata 3 Sublema dan Informasinya 4 Lafal 5 Variasi Sosial 6 Gaya Bahasa Kamus Bahasa Using-Indonesia Ketersediaan Keterangan Terdapat deinisi pada setiap ✔ entri leksikal Terdapat informasi kelas kata ✔ pada setiap entri leksikal Tidak terdapat sublema dan — informasi yang meliputinya Terdapat cara pelafalan pada ✔ setiap entri leksikal Tidak terdapat informasi variasi — sosial penggunaan bahasa ✔ Terdapat informasi gaya bahasa Tabel 4. Perbandingan Kamus Using-Indonesia dengan Kriteria Mikrostruktur (Kridalaksana, 2003) Dari beberapa kriteria di atas dapat terlihat bahwa sebagian besar mikrostruktur berdasarkan Kridalaksana telah terpenuhi. Meskipun demikian, tetap ada beberapa kriteria yang masih belum terpenuhi. Kriteria yang terpenuhi adalah pendeinisian lema, kelas kata, lafal, dan gaya bahasa. Kondisi tersebut merupakan keunggulan dari Kamus Bahasa Daerah Using-Indonesia. Bila dibandingkan dengan kamus bilingual lainnya, penulis menilai kamus bilingual ini memuat susunan lema yang terbilang banyak. Apalagi kamus ini baru pertama kali diterbitkan. Beberapa kriteria yang terpenuhi pun secara konsisten terdapat hampir di setiap lemanya. Hal ini membuat revisi atas kamus menjadi tidak terllu banyak dalam hal susunan lema. Dengan begitu, kriteria yang belum terpenuhi seperti sublema beserta informasinya dan variasi sosial tinggal ditambahkan saja untuk menambah kelengkapan susunan lema. Berbeda dengan Coward & Grimes (2000) dan Kridalaksana (2003), Atkins & Rundel (2008) menggolongkan struktur kamus terdiri dari bagian depan & belakang kamus dan konten lema kamus. Meskipun pada dasarnya sama saja dengan teori terdahulunya, Atkins & Rundel sudah menentukan bagian luar lema dengan posisi depan dan belakang kamus. Adanya pembagian tersebut, sekiranya akan memudahkan pembuat kamus untuk Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 149 149 8/2/16 11:19 AM menentukan posisi bagian luar lema. Berikut perbandingan kriteria depan dan belakang kamus dengan Kamus Bahasa Daerah Using-Indonesia. Kriteria Depan & Belakang Kamus No Kamus Bahasa Using-Indonesia Ketersediaan Keterangan Depan Kamus ✔ 1 Ucapan Terima Kasih 2 Kelas Kata ✔ 3 Penjelasan Singkat ✔ 4 Label ✔ 5 Kode ✔ 6 Sejarah Bahasa Petunjuk Kamus Komponen Lema ✔ 7 8 Terdapat informasi kelas kata pada setiap entri leksikal Tidak terdapat sublema dan informasi yang meliputinya Terdapat cara pelafalan pada setiap entri leksikal Tidak terdapat informasi variasi sosial penggunaan bahasa ✔ ✔ Belakang Kamus 1 Pedoman Ejaan ✔ 2 Variasi Regional — 3 Peta Dialek Bahasa — Terdapat pedoman ejaan pada bagian akhir kamus (lampiran) Tidak terdapat informasi variasi regional Terdapat informasi gaya bahasa Tabel 5. Perbandingan Kamus Using-Indonesia dengan Kriteria Depan & Belakang Kamus (Atkins & Rundell, 2008) Sesuai dengan kriteria depan dan belakang kamus berdasarkan Atkins & Rundell (2008), Kamus Bahasa Using-Indonesia termasuk ke dalam kamus yang sudah memenuhi kriteria depan dan belakang kamus, terutama kriteria depan kamus. Hanya variasi regional dan peta dialek bahasa saja yang belum termuat pada Kamus Bahasa Daerah Using-Indonesia. Sama seperti sebelumnya, kriteria depan kamus, seperti komponen lema, kode dan label dimasukkan menjadi satu pada bagian petunjuk penggunaan kamus. Sementara itu, penjelasan singkat bahasa, sejarah bahasa, dan ucapan terima kasih pun termuat pada satu bagian di bagian pengantar. Bahkan, ucapan terima kasih dan penjelasan singkat bahasa juga termuat pada bagian kata sambutan kepala pusat bahasa dan kata sambutan bupati Banyuwangi. Adanya pengulangan ucapan terima kasih dan penjelasan singkat bahasa menandakan bahwa kamus bilingual ini memang sangat 150 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 150 8/2/16 11:19 AM dibutuhkan bagi masyarakat Banyuwangi dan sebagai upaya pemertahanan eksistensi bahasa Using itu sendiri. Sebaliknya, jika pada kriteria depan dan belakang kamus berdasarkan Atkins & Rundell Kamus Bahasa Daerah Using-Indonesia sudah terpenuhi, pada kriteria konten lema justru belum terpenuhi. Hal ini harus dijadikan evaluasi untuk para pembuat Kamus Bahasa Daerah Using-Indonesia selanjutnya supaya lebih memerhatikan konten lema dengan lebih cermat. Berikut perbandingan kriteria konten lema dengan Kamus Bahasa Daerah Using-Indonesia seperti yang tertera di bawah ini. No Kriteria Konten Lema 1 Idiom 2 Kolokasi 3 Kata Majemuk 4 Frase Verba 5 Fonologi 6 Kalimat Kamus Bahasa Using-Indonesia Ketersediaan Keterangan — Tidak terdapat informasi idiom Tidak terdapat informasi — kolokasi Terdapat informasi kata ✔ majemuk Tidak terdapat informasi frase — verba ✔ — Terdapat informasi fonologi Tidak terdapat informasi kalimat Tabel 6. Perbandingan Kamus Using-Indonesia dengan Kriteria Konten Lema Kamus (Atkins & Rundell, 2008) Pada bagian konten lema kamus, kriteria seperti fonologi dan kata majemuk sudah terpenuhi dan kriteria idiom, kolokasi, frase verba, dan kalimat belum terpenuhi. Adanya kondisi demikian dirasa penulis wajar karena kamus bilingual ini baru pertama kali diterbitkan sehingga pembuat kamus lebih mementingkan inventarisasi lema dan belum secara mendalam memerhatikan isi konten lema atau susunan lema. Terlebih lagi, penyusun kamus merupakan linguis otodidak dan bukan linguis konvensional. Meskipun demikian, kriteria fonologi yang sudah ada ini cukup membuat penulis terkesan mengingat kriteria fonologi ini penting untuk mempermudah pembaca bukan pemelajar bahasa pertama mengucapkan bahasa Using sesuai dengan masyarakat Using itu sendiri. Sementara itu, kriteria konten lema yang belum ada pada Kamus Bahasa Daerah Using-Indonesia ini harus dijadikan bahan evaluasi dan pertimbangan apakah perlu diadakan atau tidak pada kamus bilingual ini. Hal tersebut sekiranya selain membutuhkan adanya penelitian lebih lanjut, juga dapat dijadikan dasar sebelum membuat kamus bilingual bahasa daerah. Evaluasi tersebut diharapkan dapat membuat Kamus Bahasa Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 151 151 8/2/16 11:19 AM Daerah Using-Indonesia ini menjadi lebih lengkap dan sesuai dengan kebutuhan masyarakat maupun kebutuhan penelitian yang tertarik untuk meneliti bahasa Using selain dari berbagai dokumentasi bahasa Using dari berbagai media cetak yang sekarang ini gencar dilakukan oleh masyarakat Banyuwangi. IV. SIMPULAN Berdasarkan pemaparan di atas, dapat disimpulkan bahwa Kamus Bahasa Daerah Using-Indonesia tergolong ke dalam kamus bilingual bahasa daerah yang sudah hampir mendekati kriteri-kriteria kamus atau kamus bilingual. Ini dilihat dari segi penjelasan luar lema maupun susunan lemanya itu sendiri jika dibandingkan dengan kamus bilingual bahasa daerah lainnya. Poin positif lain yaitu penyusun kamus ini merupakan linguis otodidak (Arps, 2010). Kamus yang terbit pada 2002 ini belum pernah direvisi hingga saat ini. Oleh karena itu, jika kamus ini akan direvisi atau dievaluasi, penulis berharap kamus ini menjadi semakin paripurna. Bahkan, jika evaluasi kamus nantinya dilakukan dengan menggunakan tiga kriteria (Atkins & Rundell, 2008; Coward & Grimes, 2000; Kridalaksana, 2003), bukan tidak mungkin Kamus Bahasa Daerah Using-Indonesia ini akan menjadi percontohan sebagai kamus bilingual bahasa daerah bagi kamus-kamus bilingual bahasa daerah lainnya. Sesuai dengan judul tulisan ini, berbagai sudut pandang beberapa ahli yang telah disebutkan sekiranya dapat menjadi bahan evaluasi yang komprehensif dan terbaru mengingat teori leksikograi terus berkembang dari waktu ke waktu. Perkembangan ini bisa saja melampui standar baku pembuatan kamus yang telah ditetapkan Badan Bahasa selaku pemegang otoritas kebijakan bahasa di Indonesia. Ini yang mendasari perlu adanya evaluasi pada kamus sehingga struktur kamus menjadi lebih paripurna dan lebih sesuai dengan kegunaannya di masyarakat. Selain itu, evaluasi ini akan memudahkan masyarakat menggunakan kamus dan mampu merekam perkembangan maupun perubahan bahasa yang terjadi pada bahasa Using. Maka dari itu, pada bagian di bawah ini merupakan poin-poin evaluasi atau usulan pelengkapan bagi Kamus Bahasa Daerah Using-Indonesia. Poin-poin ini merupakan kriteria yang belum dipenuhi berdasarkan kriteria kamus bilingual dari Atkins & Rundell (2008), Kridalaksana (2003), dan Coward & Grimes (2000). Lebih spesiik lagi, evaluasi ini merupakan bagian luar lema dan susunan lema jika nantinya Kamus Bahasa Daerah Using-Indonesia akan direvisi. No 1 2 3 152 Kriteria Luar Lema Jumlah entri Proil Sosiolinguistik Peta Dialek Kriteria Susunan Lema Contoh Kalimat Perbedaan Kata Aiksasi Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 152 8/2/16 11:19 AM 4 5 6 7 8 9 10 Cara Membaca Entri Petunjuk Rujuk Silang Informasi Dialek Kata Majemuk Gabungan Leksem Variasi Sosial Idiom Kolokas Frase Verba Daftar Pustaka Ali, Hasan. 2002. Kamus Bahasa Using-Indonesia. Banyuwangi: Dewan Kesenian Blambangan. Arps, Bernard. 2010. Terwujudnya Bahasa Using di Banyuwangi dan Peranan Media Elektronik di Dalamnya (Selayang Pandang 1970-2009). Dalam Mikihiro Moriyaman dan Manneke Budiman (Ed.) Geliat Bahasa Selaras Zaman: Perubahan bahasabahasa di Indonesia pasca-Orde Baru. Jakarta: Kepustakaan Populer Gramedia. Atkins, B.T. & Rundell, Michael. 2008. The Oxford Guide to Practical Lexicography. New York: Oxford Univesity Press. Budiono, Satwiko. 2015. Variasi Bahasa di Kabupaten Banyuwangi: Penelitian Dialektologi. Skripsi: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia. Coward, David. F. & Grimes, Charles. E. 2000. Making Dictionaries: A Guide to Lexicography and the Multi-Dictionary Formatter. North Carolina: SIL International. Grenger, Sylviane dan Lefer, Marie-Aude, 2016. From general to learner’s bilingual dictionaries: Towards a more effective fulillment of advanced learner’ phraseological needs. In Int J Lexicography Dipublikasikan secara daring pada 2 Juni, 2016 doi:10.1093/ijl/ecw022 Holton, Gary, dan Mahalalel Lamma Holy. 2008. Kamus Pengantar Bahasa Pantar Barat. Kerjasama antara Universitas Alaska dengan Unit Bahasa dan Budaya, GMIT. Humblé, Philippe. 2001. Dictionaries and Language Learners. Frankfurt: Haag und Herchen. Lauder, Allan. F. 2010. Data for Lexicography: The Central Role of The Corpus. Wacana, Vol. 12. No.2. 219-242. Lew, Robert. 2016. Can a dictionary help you write better? A user study of an active bilingual dictionary for Polish learners of English. Int J Lexicography dipublikasikan secara daring pertama sekali pada 2 Juni, 2016 doi:10.1093/ijl/ecw024 Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 153 153 8/2/16 11:19 AM Kridalaksana, Harimurti. 2003. Sambutan Ilmiah Pusat Leksikologi dan Leksikograi FIB UI dalam Rintisan Kajian Leksikologi dan Leksikograi. Lilie Suratminto dan Munawar Holil (Ed.). Depok: FIB UI. Pemerintah Kabupaten Banyuwangi. 2007. Peraturan Daerah Kabupaten Banyuwangi Nomor 5 tentang Pembelajaran Bahasa Daerah Pada jenjang Pendidikan Dasar. Piotrowski, Tadeusz. 1994. Problems in Bilingual Lexicography. Wroclaw: -------. Soetoko, dkk. 1981. Geograi Dialek Banyuwangi. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan Sulistyo, Basuki. 2006. Metode Penelitian. Jakarta: Wedatama Widya Sastra dan Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia. 154 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 154 8/2/16 11:19 AM Sejarah Perkembangan Leksikograi Tu Dialek di Brunei Darussalam Hajah Rosmariah binti Haji Alli Dewan Bahasa dan Pustaka, Brunei [email protected] Abstrak Leksikograi merupakan proses menyusun kamus termasuklah kosa kata atau perbendaharaan kata. Kosa kata atau perbendaharaan kata akan melambangkan kekayaan bahasa dan budaya bagi setiap masyarakat. Keseluruhan kosa kata tersebut akan dirakam dan dimasukkan ke dalam kamus. Sejarah Perkamusan di Brunei Darussalam telah bermula awal abad ke-19. Dewan Bahasa dan Pustaka telah ditubuhkan bagi mengangkat martabat bahasa, sastera, dan budaya melayu. Penubuhan Unit Perkamusan di Dewan Bahasa dan Pustaka telah diamanahkan bagi menanai misi memasyarakatkan serta membudayakan bahasa Melayu selaras dengan hasrat Bahagian Pembinaan dan Pengembangan Bahasa mendaulatkan bahasa Melayu sebagai Bahasa Rasmi Negara. Unit Perkamusan juga berfungsi menangani projek penyusunan pelbagai kamus yang menjurus kepada pengayaan bahasa Melayu. Dewan Bahasa dan Pustaka telah berusaha mulai awal tahun 1971 dengan pembentukan sebuah jawatankuasa yang menyelenggarakan penyusunan kamus Bahasa Melayu Brunei. Dewan Bahasa dan Pustaka melalui Unit Perkamusan juga telah berjaya menerbitkan beberapa buah kamus bermula dengan penyusunan Kamus Kanak-kanak terbit pada tahun 1986 sehingga menerbitkan Daftar Leksikal 7 Dialek Brunei Darussalam pada tahun 2011. Antara objektifnya ialah untuk mengongsikan perkembangan leksikograi di Brunei Darussalam kepada orang awam. Metodologi penyelidikan deskriptif dan skopnya memfokuskan lapangan dan produk kamus yang dihasilkan. Antara produk kamus yang sudah terbit ialah Kamus Kanak-kanak, Kamus Kata dan Ungkapan Am, Kamus Bahasa Melayu Nusantara, Kamus Tutong, Kamus Kedayan, Kamus Bahasa Melayu Brunei, dan Daftar Leksikal 7 Dialek Brunei Darussalam. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 155 155 8/2/16 11:19 AM I. PENDAHULUAN Menurut R.R.K Hartmann(1993:4) memberi takrif mengenai kamus ialah buku rujukan atau senarai perkataan (biasanya mengikut abjad) dengan padanan maknanya, sebutan, ejaan, atau persamaan atau padanan dalam bahasa-bahasa dan leksikograi ialah proses yang berkaitan dengan fenomena yang boleh dicerapi (iaitu kosa kata, atau leksis, atau leksikon) dan prinsip teoretis (leksikologi) untuk menanganinya. Leksikograi merupakan proses menyusun kamus termasuklah kosa kata atau perbendaharaan kata. Kosa kata atau perbendaharaan kata akan melambangkan kekayaan bahasa dan budaya bagi setiap masyarakat. Keseluruhan kosa kata tersebut akan dirakam dan dimasukkan ke dalam kamus. Di Negara Brunei Darussalam terdapat tujuh puak jati yang diiktiraf dalam perlembagaan 1959 iaitu puak Melayu Brunei, Belait, Tutong, Kedayan, Murut, Dusun, dan Bisaya. Sejarah Perkamusan di Brunei Darussalam telah bermula awal abad ke-19. Dewan Bahasa dan Pustaka telah ditubuhkan bagi mengangkat martabat bahasa, sastera, dan budaya melayu. Penubuhan Unit Perkamusan di Dewan Bahasa dan Pustaka telah diamanahkan bagi menanai misi memasyarakatkan serta membudayakan bahasa Melayu selaras dengan hasrat Bahagian Pembinaan dan Pengembangan Bahasa mendaulatkan bahasa Melayu sebagai Bahasa Rasmi Negara. Unit Perkamusan juga berfungsi menangani projek penyusunan pelbagai kamus yang menjurus kepada pengayaan dan pengembangan bahasa Melayu. Dewan Bahasa dan Pustaka telah berusaha mulai awal tahun 1971 dengan pembentukan sebuah jawatankuasa yang menyelenggarakan penyusunan kamus Bahasa Melayu Brunei. Antara beberapa matlamat penerbitan kamus ini ialah sebagai suatu dokumentasi yang merakamkan kata-kata bahasa Melayu Brunei dan pada masa itu bahan bercetak agak terbatas penerbitannya. Kamus ini dicetak juga bertujuan sebagai penyelamat supaya kata-kata tersebut tidak pupus daripada diketahui oleh generasi muda. II. OBJEKTIF KAJIAN 1. Mengongsikan perkembangan leksikograi di Brunei Darussalam kepada orang awam. 2. Mempertingkat pengetahuan belia mengenai dialek yang terdapat di Brunei Darussalam supaya tidak pupus. 3. Menggalakkan para belia untuk mengetahui pelbagai bahasa terutama dialek yang terdapat di negara ini. 4. Mendokumentasi dan mengkoordinasi kosa kata dan konteks bahasa Melayu Brunei dan dialek-dialek di Negara Brunei Darussalam dalam bentuk daftar dan kamus. 156 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 156 8/2/16 11:19 AM III. KAEDAH PENYELIDIKAN Penyelidikan ini hanya menggunakan kaedah penyelidikan lapangan kepustakaan deskriptif. IV. ANALISIS PENELITIAN Perkembangan leksikograi boleh dilihat dengan hasil penerbitan beberapa buah kamus di bawah ini: Bil 1 2 3 4 5 Nama Kamus Kamus Kanak-kanak Kamus Bahasa Melayu Brunei Tahun Terbit Cetakan Pertama 1986; Cetakan Kedua 1990 Cetakan Pertama 1991; Cetakan Kedua 1998; Edisi Kedua 2007 Cetakan Pertama 1991; Cetakan Kedua 1998 Kamus Tutong-Melayu Melayu-Tutong Kamus Kata dan Ungkapan Am 1994 Kamus Bahasa Melayu Cetakan Pertama 2003; Nusantara Edisi Kedua Cetakan Pertama Jumlah Entri 895 15,537 2000 200 105,000 6 Kamus Kedayan-Melayu Melayu-Kedayan 2006 3506 7 Daftar Leksikal 7 Dialek Brunei 2011 Darussalam 2000 4.1 Kamus-kamus Yang Sudah Terbit Kamus Kanak-kanak Cetakan Pertama 1986 Cetakan Kedua (terbitan semula) 1990 Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 157 157 8/2/16 11:19 AM Kamus Tutog-Melayu Melayu-Tutong Cetakan Pertama 1991 Cetakan Kedua 1998 Kamus Kata dan Ungkapan Am Cetakan Pertama 1994 Cetakan Kedua (Edisi Perbaikan) 2003 Edisi Kedua Cetakan Kedua 2007 Kamus Kedayan-Melayu Melayu-Kedayan Cetakan Pertama 2006 Kamus Bahasa Melayu Nusantara Cetakan Pertama 2003 158 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 158 8/2/16 11:19 AM Kamus Bahasa Melayu Brunei Cetakan Pertama 1991 Cetakan Kedua 1998 Edisi Kedua Cetakan Pertama 2007 Dewan Bahasa dan Pustaka melalui Unit Perkamusan telah berjaya menghasilkan beberapa buah kamus iaitu: 1. 2. 3. 4. 5. 6. 7. Kamus Kanak-Kanak Kamus Bahasa Melayu Brunei Kamus Kata dan Ungkapan Am Kamus Tutong-Melayu Melayu-Tutong Kamus Kedayan-Melayu Melayu-Kedayan Kamus Bahasa Melayu Nusantara Daftar Leksikal 7 Dialek Brunei Darussalam 4.1.1 Kamus Kanak-Kanak Kamus ini terbit pada tahun 1986 cetakan pertama dan cetakan kedua pada tahun 1990. Antara objektif kamus ini ialah untuk memenuhi keperluan pembelajaran kanakkanak di bawah umur 12 tahun dan untuk membimbing kanak-kanak mempelajari bahasa Melayu dengan betul. Kamus ini mengandungi informasi yang bermanfaat kepada kanak-kanak kerana kata masukannya meliputi kata yang terdapat dalam buku-buku teks sekolah rendah, kata-kata umum, nama-nama burung, ikan, dan binatang. Entri kamus ini juga mudah dan sesuai untuk kanak-kanak, termasuk kata masukan, contoh penggunaan ayat, frasa, simpulan bahasa, dan ilustrasi berwarna. Kamus ini juga sebagai rujukan di sekolah-sekolah rendah. 4.1.2 Kamus Bahasa Melayu Brunei Kamus Bahasa Melayu Brunei cetakan Pertama terbit pada tahun 1991 dan cetakan kedua terbit pada tahun 1998, dan edisi kedua terbit pada tahun 2007. Antara objektif sebagai suatu dokumentasi yang merakamkan kosa kata bahasa Melayu Brunei yang agak terbatas penggunaannya, ia juga sebagai penyelamat kosa kata tersebut supaya tidak pupus daripada diketahui oleh masyarakat, dan juga sebagai bahan rujukan kepada para penyelidik yang hendak membuat kajian ilmiah. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 159 159 8/2/16 11:19 AM 4.1.3 Kamus Kata dan Ungkapan Am Kamus ini mengandungi kata dan ungkapan am yang sama ejaan dan sebutan, tetapi membawa konotasi yang berbeza di Brunei Darussalam, Indonesia, dan Malaysia. Kata dan ungkapan am yang mempunyai makna tambahan yang membawa kelainan makna daripada bahasa Melayu, bahasa Indonesia, dan bahasa Malaysia. Bahasa Melayu Brunei merupakan dialek yang sangat popular digunakan sebagai bahasa perhubungan lisan dalam kalangan penduduk Negara Brunei Darussalam. Kamus ini bertujuan untuk melaksanakan salah satu keputusan Sidang ke-21 Majlis Bahasa Indonesia-Malaysia (MBIM), pada April 1984 dan sebagai sumbangan Negara Brunei Darussalam setelah memasuki majlis tersebut yang telah berubah menjadi Majlis Bahasa Brunei Darussalam-Indonesia-Malaysia (MABBIM), November 1985. Kamus ini telah diterbitkan cetakan Pertama pada tahun 1994. Cetakan Kedua (Edisi perbaikan) terbit 2003 tujuan penerbitannya ialah sempena menyambut 30 tahun penubuhan Majlis Bahasa Brunei Darussalam, Indonesia, dan Malaysia (MABBIM). Antara objektifnya ialah sebagai bahan rujukan dalam Sidang MABBIM dan juga membantu pengguna bahasa dalam mengenal pasti kata dan ungkapan am yang sudah mantap digunakan di ketiga-tiga buah negara. 4.1.4. Kamus Tutong-Melayu Melayu-Tutong Kamus ini terbit pada 1991 iaitu Cetakan Pertama dan telah terbit cetakan kedua pada 1998. Antara objektif kamus ini ialah supaya bahasa atau dialek berkenaan akan diketahui khususnya oleh masyarakat, supaya bahasa ini tidak akan pupus daripada pengetahuan umum, dan ia dapat dijadikan asas kepada peminat bahasa bagi penerbitan tatabahasa bahasa Tutong. Antara informasi yang terkandung dalam kamus ini ialah setiap entri bahasa Tutong dieja dalam bentuk fonemik dan diberi fonetik dan padanan dalam bahasa Melayu, untuk member kemudahan kepada pengguna kamus ini, rujuk silang Melayu-Tutong disediakan supaya orang-orang yang tidak mengetahui dialek Tutong dapat memahaminya, dan pelaksanaan kamus ini ialah melalui penyelidikan dan wawancara dengan penuturpenutur asli puak Tutong. 4.1.5 Kamus Kedayan-Melayu Melayu-Kedayan Kamus ini terbit pada 2006 dan antara objektifnya ialah mengumpul kosa kata peribumi supaya tidak pupus dan memberi pendedahan kepada generasi baru tentang bahasa Kedayan dan ia juga sebagai khazanah budaya Melayu yang boleh dijadikan rujukan umum dan bahan kajian kepada para penyelidik bahasa. Antara informasi kamus ini ialah kamus ini merakamkan kosa kata dialek puak Kedayan sebagai salah satu puak jati Melayu Brunei, penyusunan kamus ini dilaksanakan melalui penyelidikan dan wawancara dengan penutur-penutur asli bahasa Kedayan dari 160 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 160 8/2/16 11:19 AM beberapa buah kampong yang berumur dalam lingkungan 40 tahun hingga 65 tahun, kamus ini memuatkan 3236 entri Kedayan-Melayu dan rujuk silang Melayu-Kedayan sebanyak 3506 entri. Setiap entri bahasa Kedayan dieja dalam bentuk fonemik dan diberi fonetik, dan entri Kedayan-Melayu yang tiada padanannya dalam bahasa Melayu dihuraikan secara ringkas. 4.1.6 Kamus Bahasa Melayu Nusantara Projek penyusunan Kamus Bahasa Melayu Nusantara merupakan salah satu resolusi Dialog Kalimantan Ketiga yang diadakan di Brunei Darussalam pada Oktober 1992. Kamus ini terbit cetakan pertama pada 2003 dan cetakan kedua pada 2011. Antara objektifnya ialah memahami makna kata yang digunakan oleh ketiga-tiga buah negara, mengelakkan penggunaan kata yang mempunyai makna berkonotasi, mengetengahkan bahasa Melayu Brunei dalam sebuah penerbitan yang lebih luas penyebarannya, dan sebagai khazanah bahasa Melayu di samping sebagai lambing kemegahan kepada bangsa Melayu terhadap bahasa. Kamus ini memuat kosa kata bahasa Melayu Brunei, bahasa Indonesia, dan bahasa Malaysia. Penyusunannya dilaksanakan dengan kerjasama pakar dari Negara Brunei Darussalam, Indonesia, dan Malaysia. Kamus ini mengandungi kira-kira 105 000 entri: lema 47 000, sublema 26 000, peribahasa 39 000, kiasan 600, dan frasa atau kiasan 27 000. Penyusunan entri yang berbentuk “mengahwinkan” ketiga-tiga bahasa anggota MABBIM, memudahkan pengguna daripada membuka dua atau tiga kamus untuk merujuk makna kata. Penyusunan kamus ini membantu pengkaji bahasa menyelidiki kosa kata ketiga-tiga bahasa sama ada dari segi tatabahasa, ejaan, imbuhan, sebutan dan penulisan kata. 4.1.7 Daftar Leksikal 7 Dialek Brunei Darussalam Daftar Leksikal 7 Dialek Brunei Darussalam merupakan pendokumentasian kosa kata tujuh-tujuh puak jati Negara Brunei Darussalam (Dialek Melayu Brunei, Dialek Kedayan, Dialek Dusun, Dialek Tutong, Dialek Murut, Dialek Belait, dan Dialek Bisaya) yang tercatat dalam Perlembagaan Negeri Brunei 1959. Data yang terkumpul berjumlah 2000 entri bahasa Melayu yang disinonimkan dengan leksikal yang dituturkan oleh 7 puak jati Brunei. Antara objektifnya ialah untuk mengangkat bahasa puak-puak jati yang tercatat dalam Perlembagaan Negeri Brunei 1959 bagi memajukan dan mengayakan bahasa Melayu, mendokumentasi bahasa dan dialek peribumi untuk mengelak kepupusan, dan memperkaya korpus linguistik di Negara Brunei Darussalam, Kajian lapangan daftar ini ialah dengan menggunakan kajian akustik dan auditori. Penyelidikan lapangan lanjutan bagi Daftar Leksikal 7 Dialek Brunei Darussalam untuk menambah korpus dan edisi perbaikan juga telah dibuat pada December 2015 hingga April 2016. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 161 161 8/2/16 11:19 AM Hasil dapatan penyelidikan lapangan lanjutan ialah: Bil. 1 2 3 4 5 6 Dialek Dialek Melayu Brunei Dialek Bisaya Dialek Kedayan Dialek Belait Dialek Murut Dialek Tutong Dialek Dusun Jumlah 7 Jumlah entri 123 212 229 634 339 351 230 2118 Metodologi penyelidikan bagi Daftar Leksikal 7 Dialek Brunei Darussalam ini ialah: 1. 2. 3. 4. 5. Temu bual berdasarkan Swadesh Rakaman menggunakan perisian Wave Surfer (W.S) dan perisian Sound Filing System (S.F.S) Transkripsi fonetik dan fonemik Rakaman wacana spontan Penggambaran Kajian lapangan ini dilakukan dalam 3 tahap oleh 3 kumpulan. Setiap kumpulan akan menemu bual 3 orang informan dari 3 zon bagi setiap bahasa berdasarkan jadual. Lapangan tahap pertama merupakan lapangan untuk menemu bual informan secara kelompok atau kumpulan. Melalui temu bual ini, seorang informan perempuan dan seorang informan lelaki akan dipilih sebagai informan yang terjamin tuturnya untuk dirakam menggunakan perisian Wave Surfer pada tahap lapangan kedua. Rakaman pertama ini akan menggunakan perakam suara. Penyelidikan lapangan tahap ini berpandukan Swadesh. Melalui lapangan ini dapatan (kata dan padanan) akan ditranskripsi menggunakan lambang fonetik (IPA). Di samping padanan kata, contoh-contoh pemakaian kata juga akan digali secara semantik dan pragmatik bahasa yang dirakam. Lapangan tahap kedua akan mengaplikasi rakaman akustik menggunakan perisian Wave Surfer dan perisian Sound Filing System (S.F.S). Lapangan tahap ketiga pula penyelidik akan menyebut kembali dapatan kata dalam lapangan sebelumnya. Ini bertujuan untuk menyemak transkripsi fonetik dan menyemak kembali linguistic bahasa yang dikaji, iaitu fonologi, semantik, morfologi, dan sebagainya. 162 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 162 8/2/16 11:19 AM V. KAJIAN LEPAS Kajian lepas yang pernah dibuat ialah Sejarah Perkamusan di Negara Brunei Darussalam satu tugas dan tuntutan oleh Dr. Haji Jaludin bin Haji Chuchu. Kertas kerja yang dibentangkan semasa Seminar Leksikograi Sempena Pelancaran Kamus Bahasa Melayu Nusantara 2003. VI. CADANGAN Pihak Dewan Bahasa dan Pustaka, Brunei perlu menjalin hubungan kerjasama dengan Kementerian Pendidikan untuk menerapkan dialek-dialek di Brunei menjadi salah satu mata pelajaran di sekolah rendah dan menengah. Tujuannya untuk memberi galakan kepada para murid dan pelajar untuk mengetahui dialek-dialek yang terdapat di negara ini supaya tidak pupus ditelan zaman. VII. KESIMPULAN Sejarah perkembangan leksikograi di Brunei bermula dengan terbitnya Kamus Kanak-Kanak pada 1986. Ini telah menunjukkan dengan perkembangannya itu menjadi pemangkin atau platform kepada Dewan Bahasa dan Pustaka dalam upaya memupuk dan memperdaya perkembangan bahasa atau dialek di negara ini kepada masyarakat khususnya para belia, dan generasi baru. Penubuhan Unit Perkamusan di Dewan Bahasa dan Pustaka telah diamanahkan bagi menanai misi memasyarakatkan serta membudayakan bahasa Melayu selaras dengan hasrat Bahagian Pembinaan dan Pengembangan Bahasa mendaulatkan bahasa Melayu sebagai Bahasa Rasmi Negara Kementerian Pendidikan juga perlu memainkan peranan untuk mencapai visi dan misi Dewan Bahasa dan Pustaka dan menerapkan dialek-dialek menjadi mata pelajaran di sekolah-sekolah. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 5-14.indd 163 163 8/2/16 11:19 AM BIBLIOGRAFI Daftar Leksikal 7 Dialek Brunei Darussalam, 2011. Brunei: Dewan Bahasa dan Pustaka Jaludin Haji Chuchu, 2003. “Sejarah Perkamusan Di Negara Brunei Darussalam Satu Tugas dan Tuntutan” dlm Seminar Leksikograi Sempena Pelancaran Kamus Bahasa Melayu Nusantara, hlm. 1-11. Negara Brunei Darussalam: Pusat Persidangan Antarabangsa Berakas. Kamus Bahasa Melayu Nusantara, 2003. Brunei: Dewan Bahasa dan Pustaka Kamus Kedayan-Melayu Melayu-Kedayan, 2006. Brunei: Dewan Bahasa dan Pustaka Kamus Tutong-Melayu Melayu-Tutong, 1991. Brunei: Dewan Bahasa dan Pustaka R.R.K. Hartmann (ed.), 1993. Leksikograi: Prinsip dan Amalan penterjemah Zainab Ahmad. Kuala Lumpur: Dewan Bahasa dan Pustaka, Kementerian Pendidikan Malaysia. 164 Prosiding Seminar Leksikograi Indonesia PROSIDING 5-14.indd 164 8/2/16 11:19 AM Pembentukan Kamus Pewayangan Bahasa Jawa–Indonesia Berbasis Korpus Ika Nurfarida, S.S. dan Nita Suryawati, S.Hum. Magister Ilmu Linguistik Universitas Airlangga [email protected], [email protected] Abstrak Kamus memiliki peran yang cukup vital sebagai alat yang dapat membantu kita dalam memahami kosakata yang sukar dipahami. Dengan kamus, kosakata seseorang dapat berkembang. Terkait dengan peran penting sebuah kamus, maka di dalam studi ini, peneliti bermaksud mengembangkan kamus bahasa daerah, khususnya kamus pewayangan yang berbentuk kamus dwibahasa Jawa-Indonesia. Bahasa yang digunakan dalam pentas pewayangan yaitu bahasa Jawa campuran yang terdiri dari Jawa Ngoko, Jawa Krama dan Jawa Inggil. Kamus pewayangan yang akan dibentuk oleh peneliti merupakan sebuah kamus pewayangan yang berbentuk kamus saku (pocket dictionary) dengan jumlah entri kata sebanyak 500. Tujuan dibuatnya kamus ini tidak hanya diperuntukkan bagi mereka yang ingin melanjutkan studinya di bidang seni tradisional wayang kulit namun juga untuk masyarakat luas yang gemar terhadap seni tradisional wayang kulit sehingga dapat membantu mereka memahami kosakata yang terdapat dalam pentas seni pewayangan. Adapun tahap-tahap dalam pembuatan kamus di dalam penelitian ini meliputi beberapa tahap yaitu: (1) mengumpulkan kosakata yang telah ditranskip dalam sebuah pentas seni wayang kulit selama semalam suntuk yang disimpan dalam bentuk ile txt (plain text), (2) memasukkan hasil transkripsi ke alat Ant Cont 3.4 untuk mendapatkan kosakata tertinggi yang sering muncul dalam pentas seni wayang kulit, (3) menyeleksi kosakata tertinggi sebanyak 500, (4) mencari arti yang terdapat dalam bahasa pewayangan, (5) melakukan cek kosakata pada corpora. uni-leipzig.de, dan yang terakhir menyusun secara manual dalam piranti lunak Lexique Pro 3.6 untuk membentuk kamus saku bahasa pewayangan. Hasil yang didapat dari penelitian ini yaitu kamus saku (pocket dictionary) pewayangan dwibahasa Jawa-Indonesia yang berisi kosakata yang digunakan dalam pentas pewayangan. Keywords: kamus, pewayangan, bahasa Jawa, bahasa Indonesia, korpus Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 165 165 8/2/16 11:20 AM I. PeNdAHuluAN 1.1 latar Belakang Bangsa Indonesia dikenal sebagai bangsa yang kaya dengan budaya dan bahasa daerahnya. Bentangan pulau dari Sabang hingga Merauke memiliki ke khas-an bahasa daerah dan budayanya masing-masing. Salah satu fenomena yang menarik mengenai bahasa daerah di Indonesia adalah mengenai jumlah penutur bahasa Jawa. Dikatakan bahwa bahasa Jawa merupakan bahasa daerah yang memiliki penutur paling banyak diantara bahasa daerah lainnya. Dikutip dari artikel pada laman Badan Bahasa yang ditulis oleh Sugiyono dengan judul “Pelindungan Bahasa Daerah dalam Kerangka Kebijakan Nasional Kebahasaan” menyebutkan bahwa di antara bahasa Indonesia, terdapat tiga bahasa daerah yang memiliki jumlah penutur lebih dari 10 juta jiwa yakni bahasa Jawa (84,3 juta jiwa), bahasa Sunda (34 juta jiwa) dan bahasa Madura (13,6 juta jiwa). Hal tersebut sejalan dengan estimasi dari ethnologue.com yang menyebutkan bahwa Bahasa Jawa telah menempati peringkat ke 11 di dunia berdasarkan jumlah penutur setelah Bahasa Jerman pada urutan ke 10 dengan jumlah penutur sebanyak 90,3 juta jiwa. Bahasa Jawa sebagai bahasa daerah yang cukup populer keberadaanya, sangat erat kaitannya dengan seni tradisional wayang kulit, dimana dalam pementasaanya menggunakan bahasa Jawa sebagai bahasa pengantar. Seni wayang kulit yang merupakan warisan luhur budaya Jawa sarat dengan kekayaan kosakata. Hal ini dikarenakan wujud bahasa Jawa merupakan rangkaian dari variasi bahasa Jawa seperti Jawa Ngoko, Madya, dan Krama yang tidak dimiliki oleh bahasa-bahasa daerah lain di Indonesia. Variasivariasi tersebut muncul dan digunakan seorang Dalang selama pentas seni wayang kulit berlangsung. Adapun Bahasa Jawa kuno terkadang muncul di sela-sela pertunjukan yang menimbulkan perpaduan indah dengan bahasa Jawa. Dalam seni wayang kulit, seorang Dalang memegang peran yang penting sebagai penggerak wayang selama pertunjukkan dengan tanpa disadari ia menghasilkan kosakata yang banyak dan beraneka ragam. Melalui makalah ini penulis mencoba menggali kekayaan kosakata dalam seni wayang kulit dengan cara membentuk sebuah kamus pewayangan dwibahasa Jawa-Indonesia yang nantinya dapat digunakan sebagai alat belajar bagi pemula yang ingin mendalami studi dalam bidang seni wayang kulit dan juga bagi masyarakat luas secara umum. Selain itu pembuatan kamus ini juga diharapkan dapat membantu mendokumentasikan bahasa daerah khususnya bahasa Jawa yang terdapat dalam pewayangan sehingga diharapkan mampu membantu menjaga kelestariannya. 1.2 Masalah Penelitian Berdasarkan fenomena mengenai bahasa Jawa pada wayang kulit, dapat dirumuskan permasalahan yang akan dikaji dalam makalah ini. Pernyataan tersebut dapat dijabarkan ke dalam pertanyaan sebagai berikut: 166 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 166 8/2/16 11:20 AM (1) Apa saja kosakata yang muncul dalam seni wayang kulit sebagai lemma dalam kamus pewayangan bahasa Jawa-Indonesia? 1.3 Tujuan Penelitian Beranjak dari fenomena kebahasaan pada wayang kulit yang telah dirumuskan dalam masalah penelitian tersebut, penilitian ini bertujuan sebagai berikut: (1) Memperoleh kosakata yang muncul dalam seni wayang kulit yang selanjutnya digunakan untuk entri kamus pewayangan bahasa Jawa-Indonesia. 1.4 Tinjauan Pustaka Studi mengenai perkamusan pernah dilakukan sebelumnya oleh Kwary, Rusnaningtyas dan Jurianto (2007) dan Kwary (2010). Kwary, Rusnaningtyas dan Jurianto mengkaji Pengembangan Kamus Elektronik Akuntansi Berbasis Korpus. Dari penelitian tersebut diperoleh bahwa kamus elektronik akuntansi keungan Inggris-Indonesia yang dihasilkan berupa freeware dan user friendly dimana kamus elektronik tersebut dapat disalin oleh siapa saja tanpa harus membayar biaya royalti. Disamping itu, sifat kamus elektronik yang user friendly memungkinkan untuk tidak hanya digunakan namun juga mudah diperbaharui oleh siapapun. Sementara Kwary mengkaji kamus bilingual pada pengolahan bahasa. Dari penelitian tersebut dimaksudkan untuk mengetahui kamus cetak dan online Inggris-Indonesia terpopuler diantara orang Indonesia, kedua menunjukkan bagaimana kamus tersebut dimungkinkan memiliki efek negatif pada usaha pengolahan bahasa. Selanjutnya yang ketiga, mendemonstrasikan bagaimana cara mengimplementasikan pendekatan baru tersebut. Kedua penelitian diatas sama-sama meniliti mengenai kamus. Apabila Kwary, Rusnaningtyas, dan Jurianto (2007) mengembangkan sebuah kamus akuntansi elektronik yang berupa software, maka Kwary (2010) mengkaji kamus cetak dan online yang paling popular di Indonesia beserta dampak negatif dan cara pengembangannya di masa depan. Studi ini pun mengkaji pembentukan sebuah kamus Bahasa Jawa-Indonesia. Dalam studi ini, kamus yang dibentuk merupakan kamus yang memiliki istilah khusus dalam Bahasa Jawa, khususnya dalam bidang pewayangan. Tujuan dibentuknya kamus pewayangan Bahasa Jawa-Indonesia diharapkan nantinya akan dapat dimanfaatkan oleh pengguna baik sebagai pemula pembelajar seni pewayangan maupun masyarakat secara umum. Kamus yang akan dibuat ini bila digunakan untuk pemula yang ingin belajar seni pewayangan dapat membantu dalam memahami makna kata yang banyak digunakan dalam pentas wayang kulit. Sedangkan, untuk masyarakat umum dapat digunakan dalam memahami makna kata selama pentas pewayangan dikarenakan beberapa kata ada yang jarang digunakan dalam keseharian. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 167 167 8/2/16 11:20 AM II. KerANgKA TeorI Beberapa pakar memberikan deinisi mengenai kamus. Kridalaksana (1982), mendeinisikan sebagai buku referensi yang memuat daftar kata atau gabungan kata dengan keterangan mengenai berbagai segi maknanya dan penggunaannya dalam bahasa; biasanya disusun menurut abjad (dalam tradisi Yunani-Romawi menurut urutan abjad Yunani-Romawi), kemudian menurut abjad bahasa bersangkutan; dalam tradisi Arab menurut urutan jumlah konsonan. Selain itu, kamus juga dapat dideinisikan sebagai tipe paling umum sebagai referensi kerja, pertama kali digunakan sebagai “JUDUL” oleh bangsa Inggris dan Latin dalam sebuah kamus yang berjudul Dictionary of Syr Thomas Elyot Knight di London pada tahun 1538 dan kamus ekabahasa English Dictionarie; or, An Interpreter of Hard English Words di London pada tahun 1623 oleh Henry Cockeram (Hartmann & James, 1998). Di Inggris, kamus komprehensif yang pertama dibuat adalah Dictionary of the English Language pada tahun 1755 oleh Samuel Johnson. Jumlah kosakata yang terdapat dalam kamus tersebut sebanyak 40.000 entri kata. Di benua Amerika, seorang bernama Noah Webster mengikuti jejak Johnson dengan menysusn sebuah kamus dua volume yang berjudul An American Dictionary of the English Language pada tahun 1828 yang kemudian kosakata yang terdapat dalam kamus tersebut berkembang lebih banyak sekitar 7.000 entri kata. Di Indonesia, perkembangan kamus dimulai pada tahun 1951 dengan diterbitkannya Kamus Indonesia yang ditulis oleh E. St. Harahap. Berdasarkan Kamus Besar Bahasa Indonesia IV (2008), sejarah perkamusan di Indonesia dimulai dari sejarah leksikograi dengan mendaftar atau membuat glosarium ke kamus – kamus dwibahasa, kemudian ke kamus – kamus ekabahasa. Menurut catatan, karya leksikograi tertua dalam sejarah studi bahasa di Indonesia ialah daftar kata Cina-Melayu pada permulaan abad ke-15, yang berisi 500 lema. Daftar kata Italia-Melayu yang disusun Pigafetta (1522) termasuk pula karya leksikograi yang awal, sedangkan kamus tertua dalam sejarah Bahasa Indonesia ialah Spraeck ende wordboek, Inde Malaysche ende Madagaskarsche Talen met vele Arabische ende Turksche Woorden (1603) karangan Frederick de Houtman, dan Vocabularium ofte Woortboek naer order vanden Alphabet in’t Duytsch Maleysch ende Maleysche-Duytsch (1623) karangan Casper Wiltens dan Sebastian Danckaerts. Kamus – kamus Melayu itu jelas lebih tua daripada Lexicon Javanum (1841), anonim, yang naskahnya tersimpan di perpustakaan Vatikan, yang dianggap sebagai kamus Jawa tertua, yakni Nederduitsch-Maleisch en Soendasch Woordenboek (1841) oleh A. De Wilde. Daftar kata dan kamus pelopor yang multibahasa atau dwibahasa itu kemudian diikuti oleh pelbagi daftar kata dan kamus lain yang beraneka formatnya. Minat pada bahasa dan perkamusan pada zaman kolonial itu terbatas pada orang asing saja. Kamus yang disusun pun pada umumnya kamus bahasa asing-bahasa di Indonesia atau bahasa di Indonesai-asing. (Yang dimaksud dengan bahasa di Indonesia 168 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 168 8/2/16 11:20 AM ialah bahasa Melayu, Jawa, Bali, Sunda, Makassar, dan lain-lain – bukan bahasa Indonesia!). Satu – satunya kekecualian yang harus dicatat di sini ialah kamus MelayuJawa yang berjudul Baoesastra Melajoe-Djawa (1916) karangan R. Sastrasoeganda, sebagai kamus dwibahasa pertama disusun oleh putra Indonesia. Untuk kamus ekabahasa pertama disusun oleh putra Indonesia ialah Kitab Pengetahuan Bahasa, yaitu Kamus Loghat Melayu-Johor-Padang-Riau-Lingga penggal yang pertama oleh Raja Ali Haji dari Kepulauan Riau. Pada tahun 1345 Hijriah (1928 Masehi), kamus itu tercatat pada buku yang dicetak oleh Al Ahmadiah Press Singapura. Karena Raja Ali Haji hidup pada pertengahan abad ke-19, dapat dipastikan bahwa buku tersebut sudah beredar sekurang-kurangnya sudah berbentuk naskah – pada abad ke-19, seperti halnya buku pelajaran ejaan dan tata bahasanya, Bustanulkatibina (dicetak tahun 1273 H atau 1857 M). Dipandang dari teknik leksikograi sekarang, Kitab Pengetahuan Bahasa itu tidak dapat disebut kamus murni, tetapi boleh dianggap sebagai kamus ensiklopedis untuk pelajar. Sementara itu, Baoesastra Djawa (1930) karangan W.J.S. Poerwadarminta, C.. Hardjasoedarma, dan J.C. Poedjasoedira dapat dianggap sebagai pelopor perkamusan ekabahasa bahasa Jawa, seperti halnya Kamoes Bahasa Soenda (1948) karangan R. Satjadibrata. Kamus memiliki keunikan masing – masing yaitu disesuaikan dengan tipe penggunanya dan digunakan untuk apa. Sedangkan bagian pokok dari kamus yang mana termasuk cerminan kamus yang baik yaitu dapat membantu menentukan apa yang akan dimasukkan ke dalam kamus dan bagaimana materi harus terstruktur. Berdasarkan Atkins dan Rundell (2008), kebanyakan kamus memiliki dua komponen utama yaitu: kata A-Z (atau setara dengan bahasa yang tidak menggunakan alfabet Romawi) dan semua bahan yang bersifat non-linear yang dapat mengategorikan sebagai front matter dan back matter. Front matter dan back matter serta kata A-Z merupakan bagian kamus yang biasanya wajib ada dalam kamus. Front matter biasanya berisi kata pengantar dan ucapan terima kasih, semacam pengantar kamus tersebut, penjelasan singkat, label dan kode yang digunakan dalam teks. Selain itu front matter dapat berisi mini esai yang berisi tentang aspek – aspek tertentu dari bahasa tergantung dari pangsa pasar yang dituju. Back matter (materi akhir) sering mencakup daftar seperti, daftar kata kerja, nomer, berat dan ukuran, unsur – unsur kimia, penomeran Romawi, buku – buku dari Alkitab dan lain – lain. Selain itu juga dapat berisi peta, diagram, dan materi lainnya disesuaikan dengan kebutuhan pengguna kamus tersebut. Dalam kamus dwibahasa dapat mencakup tentang faux amis dan panduan praktis untuk berbagai aspek kehidupan tentang negara pengguna dua bahasa. kategori selanjutnya yaitu kata A-Z, dalam pemilihan pengisian didorong oleh proil pengguna, target pasar dari kamus, pesaingnya di pasar, dan akibat dari biaya dan anggaran. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 169 169 8/2/16 11:20 AM 2.1 Tipe Kamus Ada berbagai tipe kamus dilihat dari entri dalam kamus yang dapat menjadi ciri khas dari kamus. Sebagian besar para leksikografer berfokus pada tipe kamus yang akan dibentuk di mana akan menjadi tipe apa kamus tersebut. Dalam Atkins dan Rundell (2008) terdapat 4 tipe entri yaitu standar leksikal, gramatikal, kata – kata singkatan (abbreviation), dan kata ensiklopedia. Berikut beberapa penjelasan tentang tipe kamus berdasarkan entrinya: 2.1.1 entri Standar leksikal Entri standar leksikal yaitu dengan memasukkan kata berdasarkan kelas katanya (part of speech) di mana kelas kata sangat penting dalam sebuah pembentukan kamus. Setiap kata yang memiliki makna dapat disebut leksikal karena kata – kata leksikal membawa deinisi makna yang penuh dan kontribusinya di dalam kalimat untuk memperkuat makna dari kaimat tersebut. Leksikografer memasukkan headwords ke dalam kamus yang selanjunnya diberi klasiikasi kelas katanya yang mana dalam Bahasa Indonesia terdapat verba, nomina, adjektiva, adverbia, numeralia, partikel, dan pronomina. Entri standar leksikal dapat dilihat dalam gambar di bawah ini: gambar 1. dengan lema “sabar” Dari gambar 1 yang merupakan kata “sabar” diambil dari Kamus Besar Bahasa Indonesia IV menunjukkan bahwa ada turunan kata yang terbentuk setelah adanya sufix. Dari kata – kata tersebut memiliki kelas kata yang berbeda, yang ditunjukan dengan lingkaran merah yang terdapat dalam gambar 1. 170 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 170 8/2/16 11:20 AM Selain kelas kata dalam entri standar leksikal berupa IPA atau cara baca secara fonetik dalam bahasa tujuan. Seperti pada kamus Indonesia-Inggris terdapat cara baca kata tersebut dalam bahasa Inggris bila kamus tersebut dwibahasa. 2.1.2 entri Kata Singkatan (Abbreviation Entry) Entri kata singkatan, tidak banyak membawa informasi karena kata – kata tersebut jarang memiliki lebih dari satu arti kata dan jarang memiliki lebih dari satu wordclass. Kata singkatan menyerupai memasukkan nama yang tepat. Namun, entri kata – kata singkatan harus memiliki referensi silang dalam bentuk penuh. Biasanya karena alasan tempat yang disediakan, alasan yang diberikan hanya sekali baik dalam memasukkan singkatan atau yang dalam bentuk utuh. 2.1.3 entri Kata gramatikal Entri berdasarkan gramatikal lebih mementingkan fungsi dari kata tersebut bila diterapkan ke dalam kalimat. Dalam kamus gramatikal, tidak hanya menyajikan fungsi kata dalm kalimat tetapi merancang cara paling baik untuk menyajikan informasi agar pengguna dapat memahami dengan mudah dan benar. Selain itu harus mempertimbangkan ketrampilan dan kebutuhan pengguna. Wordclass dan subclasss melakukan fungsi berbeda, tidak ada struktur yang dirancang untuk entri bahasa. Dalam pembentukannya fungsi headword adalah pembahas dan pemberi contoh dalam cara memasukkannya, dan karena fungsi yang mungkin juga dilakukan oleh konjunsi lainnya jadi informasi tentang kata tersebut masuk ke dalam bagian kamus. Kamus yang menggunakan gramatikal entri yaitu kamus penutur asli dan kamus pembelajaran (ekabahasa dan dwibahasa) yang sangat bergantung pada catatan penggunaan ketika berhubungan dengan kata – kata gramatikal. 2.1.4 entri ensiklopedis Yaitu memasukkan keterangan tentang penamaan yang tepat yang tentunya lebih ringkas dari entri leksikal dan entri gramatikal. Dalam kamus monolingual untuk hal – hal yang berbau ensiklopedis akan lebih bervariasi jumlah informasi yang diberikan. Sedangkan dalam kamus bilingual terjemahan sederhana sudah cukup memberikan informasi yang dibutuhkan pengguna. Entri ensiklopedis dapat berupa nama dari tokoh yang disingkat, sehingga memerlukan catatan khusus untuk menjelaskan. Dari berbagai macam kamus yang dijelaskan di atas, penulis mencoba membuat kamus yang bersifat standar leksikal entri karena lebih praktis digunakan dan sudah mencakup beberapa contoh penggunaannya. Kamus pewayangan ini berupa kamus dwibahasa yaitu Jawa-Indonesia yang sudah terdapat keterangan dari leksikal dan contoh secara gramatikal. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 171 171 8/2/16 11:20 AM 2.2 Penulisan entri Kamus pewayangan dwibahasa Jawa-Indonesia yang dibentuk oleh penulis dengan standar leksikal entri mengikuti aturan dalam proses penulisan entrinya. Atkins dan Rundell (2008) menyatakan bahwa ada beberapa hal yang perlu diperhatikan oleh leksikografer apabila menulis entri pada sebuah kamus yakni; menentukan arti (sense), memberikan terjemahan, memilih contoh, mengindikasikan arti, dan melengkapi entri. Berikut penjelasan mengenai aturan dalam penulisan entri diatas: 2.2.1 Menentukan Arti Dalam menentukan arti dari headword pada kamus dwibahasa akan sangat berbeda dengan kamus ekabahasa. Apabila kamus ekabahasa menyesuaikan arti dengan headword (dimana arti kata/senses) yang ditulis sebagai arti dari headword dapat berupa lebih dari satu deinisi yang masih berkorelasi dengan arti dari headword tersebut), maka kamus dwibahasa hanya menggunakan padanan kata atau kata yang setara dengan arti dari headword nya saja. gambar 2. Dengan lema “column” Dua contoh diatas merupakan contoh kamus ekabahasa (ODE-2) dan kamus dwibahasa (CRFD-8). Kamus dwibahasa tidak terlalu terpaku pada bahasa sumber (Source Language/SL) dalam memberikan arti pada lema, tetapi secara sederhana memberikan arti kata untuk dipahami. Arti kata pada kamus dwibahasa lebih didasarkan pada bahasa sasaran (Target Language/TL) daripada bahasa sumber pada headword selama konten semantik pada unit leksikal terkait cukup mirip atau setara. 172 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 172 8/2/16 11:20 AM 2.2.2 Memberikan Terjemahan Dalam memberikan terjemahan arti dari headword pada kamus dwibahasa yakni memberikan ide yang jelas mengenai arti kata secara langsung terhadap headword kepada pengguna dengan mengetahui batas-batas terhadap terjemahan yang tidak sesuai, sehingga dapat mengungkapkan konsep dari headword dengan jelas. Adapun jenis terjemahan yang dapat digunakan sebagai pedoman para leksikografer adalah terjemahan langsung dan komponen terjemahan lain. Dalam menggunakan terjemahan langsung pada pemberian arti kata pada headword, pilihan kata yang digunakan dalam bahasa sasaran harus yang benar-benar setara dengan bahasa sumber. Sedangkan dalam menggunakan komponen terjemahan lain adalah sebuah teknik yang dapat digunakan dalam memberikan arti kata jika tidak didapatkan kata yang menjadi terjemahan langsung dari headword. Penggunaan arti kata yang paling dekat (Near-Equivalent) dan daftar istilah (Glosses) dapat dipilih sebagai strategi dalam memberikan arti kata. Kata “Foreign” pada CRFD-5 diartikan dengan memberikan kedekatan arti kata menjadi “Foreign Secretary” yang berarti ministre dalam bahasa Perancis. Adapun strategi yang paling bagus dalam memberikan arti kata yang tidak didapatkan terjemahannya secara langsung adalah dengan memberikan terjemahan berupa contoh dalam kalimat dengan disertai arti dalam bahasa sasarannya. Kasus tersebut dapat dilihat pada gambar berikut. gambar 3. Dengan lema “next” Kata next pada kamus OHFD-3 diatas dapat diberikan arti dengan memberikan contoh kalimat dan diterjemahkan langsung ke dalam bahasa sasarannya yaitu Perancis. Startegi tersebut dapat memiliki kegunaan dalam mengatasi ketidakhadiran arti kata dari terjemahan langsung yang memang tidak ada. 2.2.3 Memilih Contoh Pemberian contoh dari kata utama sebagai lema (headword) yang bertujuan untuk memberikan kemudahan kepada pengguna kamus, maka para leksikografer perlu memperhatikan beberapa aspek seperti arti kata yang seperti apakah yang akan diterjemahkan dari kata utama (headword), meyakinkan pengguna terhadap penggunaan Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 173 173 8/2/16 11:20 AM terjemahan langsung, melengkapi (atau mengganti) terjemahan langsung; bilamana terjemahan tersebut tidak dapat digunakan, atau sederhananya bila pengguna kamus membutuhkan kata yang berbeda, dan yang terakhir adalah menentukan arti dari kata yang merupakan bahasa sasaran (TL) yang memiliki deinisi lebih dari satu. 2.2.4 Mengindikasi Arti Sebelum diputuskan untuk memberikan arti pada kata yang akan dientri, maka melakukan indikasi terhadap arti kata sangatlah penting. Hal ini dimaksudkan guna mengantasipasi arti kata yang bersifat komplikasi dan sulit untuk diberikan artinya. Ada tiga tipe utama yakni speciiers, kolokator, dan juga domain label yang disebutkan oleh Atkins dan Rundell (2008) yang dapat digunakan sebagai cara mengindikasi arti kata. Speciiers dijelaskan berwujud sebagai sinomin atau paraphrase dalam menjelaskan arti sebuah kata utama (headword), sedangkan kolokator berupa kata yang selalu mengikuti kata utama (headword), dan yang terakhir adalah domain label yang berfungsi untuk membantu penutur bahasa sumber dalam memahami konsep dari domain label headword seperti yang dicontohkan pada label “Ind” untuk kata “Industry” pada kata gabungan kata “design ofice”, sehingga penutur bahasa sumber memahami konsep design kantor seperti apakah yang dimaksud. 2.2.5 Melengkapi entri Tahap ini merupakan tahap akhir dalam penulisan entri sebuah kamus. Pada tahap ini seluruh proses penentuan arti (sense) pada kamus, pemberian contoh, hingga memberikan terjemahan telah selesai dilakukan. Untuk memastikan bahwa entri seluruh kosakata dengan deinisinya telah dilakukan dengan baik, maka ada baiknya untuk membaca dan meninjau kembali hasil entri pada kamus. Waktu terbaik untuk membaca kembali adalah setelah satu atau dua minggu setelah proses entri selesai. III. MeTode PeNelITIAN Metode yang digunakan dalam penelitian ini adalah metode deskriptif kualitatif yang bertujuan untuk memberikan penjelasan secara detail tentang permasalahan dalam penelitian terkait dengan data dan fenonema. Adapun teknik pengolahan data dalam penelitian ini yakni melalui beberapa tahap; Pertama, mentranskrip rekaman dalam bentuk tulisan pada Ms. Word dan disimpan dalam bentuk ile txt (plain text), Kedua, memasukkan hasil transkripsi ke alat Ant Cont 3.4 untuk mendapatkan kosakata tertinggi yang sering muncul dalam pentas seni wayang kulit sebanyak 500 kata. Ketiga, menyeleksi kosakata tertinggi sebanyak 30 kosakata sebagai sampel kosakata yang berkaitan dengan bidang pewayangan. Untuk memastikan kosakata yang akan dipilih sebagai lema, penulis terlebih dahulu melakukan cek kosa kata melalui http://corpora.uni-leipzig.de untuk 174 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 174 8/2/16 11:20 AM memastikan bahwa kosakata tersebut merupakan kosakata berfrekuensi tinggi. Keempat mencari arti dari kosakata yang telah dipilih. Dalam hal ini, penulis secara langsung terjun ke lapangan menemui seorang informan yang tidak lain adalah seorang Dalang wayang kulit guna membantu memberikan arti kata. Selanjutnya, langkah terakhir yang dilakukan adalah menyusun secara manual satu per satu kosakata dalam piranti lunak Lexique Pro 3.6 untuk membentuk kamus saku (pocket dictionary) pewayangan. IV. ANAlISIS PeNelITIAN Pembuatan kamus berbasis korpus sebagai salah satu metodologi dalam pemilahan data yang dilakukan oleh penulis dengan cara mengambil kosakata yang berasal dari pementasan wayang kulit. Oleh karenanya terdapat kosakata yang menggunakan Bahasa Jawa ataupun Bahasa Jawa Kuno. Bahasa-bahasa tersebut tetap dilestarikan dalam pementasan wayang kulit karena dapat digunakan sebagai media pembelajaran. Berdasarkan data yang didapat dari piranti lunak Ant Conc 3.4, maka kosakata yang muncul dapat dilihat sebagai berikut: gambar 4. Kosakata pada piranti lunak AntConc 3.4 Hasil dari transkripsi yang telah diproses ke dalam piranti lunak AntConc 3.4 diperoleh total kosakata sebanyak 2.524 kata. Gambar diatas merupakan wujud kosakata yang muncul secara urut dari frekuensi tinggi ke frekuensi yang paling rendah. Terlihat bahwa kata seperti kula, aku, tak, ora berada pada urutan paling atas. Sehubungan dengan pemilihan kosakata yang akan dimasukkan ke dalam entri, maka kata-kata tersebut tidak begitu saja dipilih sebagai lema. Terlebih dahulu dilakukan cek kosakata satu persatu di http://corpora.uni-leipzig.de guna memastikan bahwa kosakata tersebut tidak termasuk sebagai kata yang bersifat umum di dalam penggunaannya sehari-hari. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 175 175 8/2/16 11:20 AM Apabila ditemukan bahwa kata tersebut memilki kelas frekruensi rendah, maka tidak akan dipilih sebagai lema. Hal tersebut mencerminkan bahwa dengan rendahnya frekuensi kelas sebuah kata, maka kata tersebut merupakan kata yang umum digunakan. Berikut contoh kosakata yang telah dilakukan cek pada corpora.uni-leipzig. gambar 5. Kata “ora” dengan kelas frekuensi rendah Kata “ora” sebagai salah satu contoh kosakata yang dibuktikan sebagai kata yang memiliki kelas frekuensi rendah dengan menunjukkan angka 3. Jika ditinjau kembali kata tersebut, maka dalam percakapan sehari-hari kata “ora” bersifat umum dan sering dijumpai dalam percakapan sehari-hari. Dengan melakukan cek kosakata pada corpora. uni-leipzig.de dapat membantu penulis dalam pemilihan kosakata secara akurat. Sehingga dalam proses entri kata, penulis tidak memasukkan kata “ora” sebagai lema dalam kamus pewayangan. Selanjutnya kata yang memiliki kelas frekuensi tinggi juga dilakukan cek kosakata. Adapun contoh kata tersebut dapat dilihat sebagai berikut. gambar 6. Kata “kakang” dengan kelas berfrekuensi tinggi 176 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 176 8/2/16 11:20 AM gambar 7. Kata “pagebluk” dengan kelas frekuensi tinggi Kata “kakang” dan “pagebluk” ditemukan sebagai kata yang memiliki kelas frekuensi kata yang tinggi yakni 11 dan 13. Hal ini mencerminkan bahwa kata tersebut sedikit digunakan dalam percakapan sehari-hari, bersifat khusus dan digunakan dalam keperluan secara khusus dalam pentas seni wayang kulit. Kata-kata tersebut yang kemudian dipilih sebagai lema dalam kamus pewayangan bahasa Jawa-Indonesia. Tahap selanjutnya setelah lema yang dipilih telah terkumpul adalah dengan memberikan arti kata terhadap lema. Pemberian arti yang dilakukan oleh penulis yaitu berdasarakan entri standar leksikal. Penulis memasukkan kata berdasarkan kelas katanya (part of speech) kemudian memberikan deinisi maknanya. Lema atau headwords selanjunnya diberi klasiikasi kelas katanya seperti verba, nomina, adjektiva, adverbia, numeralia, partikel, dan pronomina. gambar 8. lema “ulun” merupakan nomina gambar 9. Kata “kakang” dalam Concordance Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 177 177 8/2/16 11:20 AM Setelah lema sudah dientri dan diberikan kelas katanya, maka penulis memberikan contoh kalimat dalam entri tersebut. Contoh kalimat yang dimasukkan dalam entri merupakan kumpulan kalimat yang terdapat dalam concordance. Kalimat tersebut disederhanakan kembali kedalam kalimat guna memudahkan pengguna kamus mudah dalam memahami katanya. Seperti contoh kata “kakang” yang terdapat pada Gambar. 9 diatas dijadikan contoh kalimat dalam entri lema “kakang” pada kamus. Jika kalimat dinilai mudah, maka tidak dilakukan penyederhanan seperti kata “kakang” yang terdapat dalam kalimat “kakang Abimanyu lan kakang Gatutkaca budhal nang Negara Pura Kencana” dan kemudian diterjemahkan kedalam bahasa Indonesia menjadi “ kakak Abimanyu dan kakak Gatutkaca berangkat ke Negara Pura Kencana.” Kosakata yang telah diseleksi oleh penulis sebanyak 500 kata kemudian satu persatu mulai dilakukan entri ke dalam piranti lunak Lexique Pro 3.6 untuk mulai dibuat kamus. Proses entri kosakata setelah dimasukkan satu persatu ke dalam piranti lunak lexique pro dapat dilihat sebagai berikut: gambar 10. Hasil entri dalam Lexique Pro 3.6 Tabel di atas merupakan contoh entri kosakata yang telah dimasukkan satu persatu ke dalam piranti lunak lexique pro yang secara otomatis akan tersusun secara alfabetikal. Kosakata yang terdapat dalam piranti lunak di atas terlihat bahwa kosakata yang dipilih sebagai lemma secara khusus berupa kosakata yang berhubungan dengan bidang pewayangan. Seluruh lemma yang telah dientri satu persatu kemudian akan disimpan ke dalam bentuk Ms. word yang nantinya akan dibuat sebagai kamus cetak pewayangan bahasa Jawa-Indonesia. Adapaun wujud kamus cetak yang telah dibentuk ke dalam Ms. word dapat dilihat pada gambar sebagai berikut: 178 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 178 8/2/16 11:20 AM gambar 11. Hasil Lexique Pro dalam Microsofr Word Gambar di atas merupakan wujud kamus cetak pewayangan bahasa Jawa-Indonesia yang telah diolah menjadi sebuah kamus cetak yang nantinya dapat digunakan oleh pengguna. Kamus pewayangan bahasa Jawa-Indonesia yang dibentuk oleh penulis tidak hanya memberikan arti dalam bentuk sinonim dan uraian singkat, namun kamus ini dibuat disertai contoh penggunakan kata dalam sebuah kalimat. Hal ini bertujuan untuk memberikan pemahaman yang lebih dalam tentang penggunaannya dalam sebuah kalimat, sehingga pengguna tidak hanya memahami arti namun juga dapat mengaplikasikan dalam bentuk kalimat yang nantinya dapat digunakan sebagai penunjang wawasan baik secara lisan maupun tulisan. V. SIMPulAN Dewasa ini, kesenian wayang kulit jarang diadakan dan jarang pula orang yang mengerti dengan bahasa yang digunakan selama pertunjukan wayang kulit. Ketidakpahaman masyarakat dikarenakan bahasa yang digunakan berbeda dengan bahasa yang digunakan sehari – hari. Pertunjukannya jarang diadakan karena biaya pengadaan yang mahal dan sudah jarangnya generasi muda yang menyukai pertunjukan wayang kulit. Alasan tersebut dapat dibuktikan dengan sudah jarangnya pemnetasan wayang kulit dan penonton yang rata-rata didominasi orang tua. Bahasa yang digunakan selama pementasan wayang kulit terdiri dari Bahasa Jawa dan Bahasa Jawa Kuno. Bahasa tersebut telah dipelajari secara turun temurun dan telah dibukukan untuk mempermudah dalam pembelajaran. Untuk Bahasa Jawa telah adanya Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 179 179 8/2/16 11:20 AM kamus Bahasa Jawa-Indonesia ataupun Bahasa Jawa Monolingual yang diterbitkan oleh beberapa institusi. Sedangkan penulis mencoba untuk membuat contoh dan cara dalam pembuatan bahasa yang digunakan dalam kesenian wayang kulit. Bahasa yang digunakan berbeda menurut makna leksikal maupun secara grammatikal penggunaannya. Bila dalam kamus Bahasa Jawa-Indonesia atau Bahasa Jawa Monolingual berbentuk kumpulan kosakata dari bahasa tersebut, tetapi dalam kamus pewayangan Jawa-Indonesia yang penulis buat tidak dapat berupa satu kosakata. Dalam kamus ini penulis menemukan beberapa kata yang tidak dapat berdiri sendiri karena tidak memiliki arti bahkan dapat berarti berbeda dalam penerapan kesenian wayang kulit. Kamus pewayangan ini merupakan kamus teknik yang dihasilkan dari linguistik terapan yaitu leksikograi. Dari pembuatan kamus ini diharapkan dapat membantu pelajar yang mempelajari kesenian tradisional dan masyarakat luas. Pelajar yang mempelajari kesenian tradisional diharapkan dengan mengetahui makna dari kosakata yang dipelajarinya sehingga dapat mempertahankan dan mengembangkan kesenian tradisional seperti wayang kulit yang sudah mulai jarang dikenal dan diminati. Sedangkan untuk masyarakat umum, dengan adanya kamus ini diharapkan dapat membantu untuk mengerti kosakata yang digunakan selama pertunjukan wayang kulit. Semoga dengan adanya kamus ini dapat membantu pelajar maupun masyrakat luas. daftar Pustaka Atkins, B.T., Rundell, Michael. 2008. The Oxford Guide to Practical Lexicography. New York: Oxford University Press. Hartmann, R. R. K., & James, G. (1998). Dictionary of lexicography. Psychology Press. Kwary, D. A. (2010). Bilingual Dictionaries in Language Cultivation. Kwary, D. A, Rusnaningtyas, E, & Jurianto. (2007). Pengembangan Kamus Elektronik Akuntansi Berbasis Korpus. Nation, I.S.P. 2001. Learning Vocabulary in Another Language. Cambridge: Cambridge University Press. Sugiono, Dendy. (2008). Kamus Besar Bahasa Indonesia Pusat Bahasa: Edisi Keempat. Jakarta: PT. Gramedia Pustaka Utama Wilkins, D.A. 1972. Linguistics and Language Teaching. London: Edward Arnold. http://badanbahasa.kemdikbud.go.id/lamanbahasa/content/pelindungan-bahasa-daerahdalam-kerangka-kebijakan-nasional-kebahasaan http://corpora.uni-leipzig.de https://www.ethnologue.com/statistics/size 180 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 180 8/2/16 11:20 AM redesain Kamus Bahasa Jawa Berdasarkan Tingkatan Bahasa Jawa (Bahasa Jawa Ngoko, Krama Madya, Krama InggilI) Afwin Sulistiawati, S.Pd. Universitas Airlangga [email protected] Abstrak Penelitian ini dilatarbelakangi oleh realita bahwa kamus-kamus bahasa Indonesia-bahasa Jawa atau bahasa Jawa-bahasa Indonesia yang sudah ada hanya menyuguhkan arti kata saja. Misalnya dari kata berbahasa Jawa diartikan ke dalam bahasa Indonesia atau sebaliknya. Sedangkan pengguna kamus sering kali menemukan kesulitan ketika akan menggunakan bahasa Jawa karena arti yang ada di dalam kamus hanyalah satu jenis bahasa Jawa saja. Sedangkan bahasa Jawa sendiri memiliki tiga tingkatan bahasa yang bahkan memiliki kata-kata yang berbeda dari setiap tingkatan bahasa Jawa tersebut. Adanya tiga tingkatan tersebut berdasarkan tingkat kesopanan. Misalnya dalam bahasa Indonesia kata ‘pakai’ bisa diartikan menjadi 3 kata yang berbeda sesuai tingkatan bahasa Jawa, yakni ‘anggo’, ‘angge’, ‘agem’ (bahasa Jawa Ngoko, Krama Madya, Krama Inggil). Hal itulah yang belum ada dalam perkamusan bahasa Jawa padahal dalam penggunaannya, itu sangat diperlukan. Bila bahasa Inggris memiliki perubahan kata kerja dipengaruhi oleh waktu, dalam bahasa Jawa terdapat perubahan kata dipengaruhi oleh tingkat kesopanan atau tingkatan bahasa Jawa. Oleh karena itu, penelitian ini bertujuan mengumpulkan sebanyak-banyaknya kata yang memiliki perubahan berdasarkan tingkatan bahasa Jawa untuk kemudian dimasukkan ke dalam kamus. Artinya, jika ingin mengetahui penggunaan suatu kata dalam bahasa Jawa, maka kamus akan bisa membantu dengan cara menyuguhkan kosakata-kosakata dalam tiga tingkatan bahasa Jawa. Kosakata-kosakata itu didapat dari 10 sumber data (manula di Yogyakarta yang dipercaya sebagai pengguna bahasa Jawa sesuai dengan tiga tingkatan bahasa Jawa [empunya bahasa Jawa]). Data penelitian ini berupa hasil perumusan kosakata sesuai tingkat kesopanan atau tingkatan bahasa Jawa. Secara akademik, penelitian ini diharapkan bermanfaat bagi Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 181 181 8/2/16 11:20 AM pengembang leksikograi, terlebih bagi pembuat dan pengguna kamus bahasa Jawa. Secara praktis, penelitian ini diharapkan dapat menambah pengetahuan di bidang kosakata berdasar tiga tingkatan bahasa Jawa. Dari hasil analisis, diperoleh bahwa tidak semua kata memiliki perbedaan kosakata berdasar tingkatan bahasa Jawa dan telah didapatkan 430 kosakata yang dapat disajikan di dalam kamus. Data-data tersebut siap dimasukkan ke dalam kamus bahasa Jawa untuk membantu para penggunanya. Keyword: bahasa Jawa Ngoko, Krama Madya, Krama Inggil I. PeNdAHuluAN 1.1 latar Belakang Kamus-kamus bahasa Indonesia-bahasa Jawa atau bahasa Jawa-bahasa Indonesia yang sudah ada hanya menyuguhkan arti kata saja. Baik kamus online, ofline, maupun kamus cetak. Pengartian itu misalnya dari kata berbahasa Jawa diartikan ke dalam bahasa Indonesia atau sebaliknya. Misalnya kata ‘mata’ di dalam kamus berarti netra; mripat; pandeleng. Pengartian semacam itu hanya menunjukkan kosakata dalam beda bahasa saja, misal bahasa Jawa dialihkan ke bahasa Indonesia atau sebaliknya, tanpa ada tambahan pengetahuan mengenai kosakata berdasarkan tingkatan bahasa Jawa, devinisi, atau contoh penggunaannya. Sedangkan pengguna kamus sering kali menemukan kesulitan ketika akan menggunakan bahasa Jawa karena arti yang ada di dalam kamus hanyalah satu jenis bahasa Jawa saja. Kalaupun ada aplikasi kamus yang bisa dibeli di Play-Store yang menyuguhkan tingkatan kata dalam bahasa Jawa tetapi hanya kata-katanya saja yang disuguhkan. Di dalamnya tidak terdapat contoh atau deinisi dari kata yang sedang dicari sehingga belum cukup membantu para pengguna kamus bahasa Jawa-bahasa Indonesia atau bahasa Indonesia-bahasa Jawa. Bahasa Jawa sendiri memiliki tiga tingkatan bahasa yang bahkan memiliki kata-kata yang berbeda dari setiap tingkatan bahasa Jawa tersebut. Adanya tiga tingkatan tersebut berdasarkan tingkat kesopanan, yakni bahasa Jawa Ngoko yang biasa digunakan dalam keadaan santai dan cenderung tidak sopan, Krama Madya yang cenderung setengah sopan, dan Krama Inggil yang bisa dikatakan sangat sopan. Pembagian tingkatan bahasa Jawa tersebut merupakan salah satu budaya berbahasa yang ada di Jawa. Dalam bahasa Jawa ada pepatah “Ajining dhiri dumunung ana ing lathi”, artinya bahasa merupakan cerminan jati diri si pembicara. Sapir (dalam Blount, 1974) menyatakan bahwa kandungan tiap budaya terwujud di dalam bahasanya. Oleh karena itu tingkatan 182 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 182 8/2/16 11:20 AM bahasa Jawa ini dapat dikatakan sebagai bagian dari budaya Jawa. Contoh tingkatannya misalnya dalam bahasa Indonesia kata ‘pakai’ bisa diartikan menjadi 3 kata yang berbeda sesuai tingkatan bahasa Jawa, yakni ‘anggo’, ‘angge’, ‘agem’ (bahasa Jawa Ngoko, Krama Madya, Krama Inggil) (Nugroho, TT: 80). Hal itulah yang belum ada dalam perkamusan bahasa Jawa padahal dalam penggunaannya, itu sangat diperlukan. Oleh karena itu penelitian ini perlu dilakukan untuk memenuhi kebutuhan pengguna kamus bahasa Jawa dan untuk mengembangkan leksikograi bahasa daerah sehingga rumusan masalah dalam penelitian ini adalah bagaimana bentuk redesain kamus bahasa Jawa berdasarkan tingkatan bahasa Jawa (bahasa Jawa Ngoko, Krama Madya, Krama Inggil). 1.2 rumusan Masalah Berdasar pada judul di muka, rumusan masalah yang akan dibahas dalam penelitian ini adalah bagaimana bentuk redesain kamus bahasa Jawa berdasarkan tingkatan bahasa Jawa (bahasa Jawa Ngoko, Krama Madya, Krama Inggil). 1.3 Tujuan Tujuan dari diadakannya penelitian ini adalah untuk mendeskripsikan dan menunjukkan bentuk redesain kamus bahasa Jawa berdasarkan tingkatan bahasa Jawa (bahasa Jawa Ngoko, Krama Madya, Krama Inggil) sehingga penelitian ini akan bisa bermanfaat bagi pengguna kamus. 1.4 Tinjauan Pustaka Penelitian terdahulu yang relevan dengan penelitian ini adalah penelitian yang dilakukan oleh Agustinus Ngadiman dengan judul Tingkat Tutur Bahasa Jawa: Wujud Kesantunan Manusia Jawa (Dulu dan Sekarang) pada tahun 2006. Kesamaan dengan penelitian tersebut ialah sama-sama meneliti tentang bahasa Jawa dan bahkan kesantunannya tetapi fokus penelitiannya berbeda, penelitian tersebut terfokus pada aspek tindak tutur masyarakat Jawa sedang penelitian ini terfokus pada tingkatan bahasa Jawa di dalam kamus. Penelitian ini merupakan penelitian yang berjenis penelitian kualitatif dengan menyajikan hasil penelitian berupa kata-kata dalam perkamusan. Sumber data yang digunakan dalam penelitian ini adalah 10 manula yang ada di Yogyakarta dan merukan empunya bahasa Jawa karena merekalah yang menggunakan tiga tingkatan bahasa Jawa itu dalam kehidupan sehari-harinya. Sedangkan data yang dipakai dalam penelitian ini adalah tuturan mengenai pengartian kata dalam bahasa Indonesia ke bahasa Jawa atau sebaliknya, mereka juga menunjukkan bagaimana kosakata-kosakata sesuai dengan tingkatan bahasa Jawa. Teknik pengumpulan data dalam penelitian ini adalah teknik rekam, simak dan transkripsi. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 183 183 8/2/16 11:20 AM II. KerANgKA TeorI dAN MeTode PeNelITIAN 2.1 Kerangka Teori Leksikograi sering diartikan sebagai cabang ilmu bahasa yang mempelajari teknik penyusunan kamus. Kegiatan yang terlibat dalam ilmu leksikograi di antaranya adalah perancangan, kompilasi, penggunaan, serta evaluasi suatu kamus. Namun terdapat juga pandangan bahawa leksikograi merupakan satu cabang linguistik terapan dan garapannya mencakup teknik dan metodologi penyusunan, seperti yang ditegaskan oleh Kridalaksana (1985). Juga ada pendapat lain mengenai leksikograi yakni leksikograi merupakan satu cabang linguistik terapan yang mencakup pemerhatian, pengumpulan data, pemilihan data dan membuat pemerian unit dan stok perkataan serta kombinasi perkataan (frasa) dalam satu atau lebih bahasa. Selain pendapat-pendapat di muka, leksikograi juga mencakup perkembangan dan deskripsi teori dan kaidah yang menjadi dasar kegiatan penyusunan kamus. Ini melibatkan bentuk leksikal unit semantik dalam bahasa, biasanya disusun berdasar abjad. Malkiel (dalam Sariyan, 2014: 363) juga mengemukakan bahwa leksikograi, dalam makna yang sempit, merupakan subbagian linguistik terapan yang berkaitan dengan tenik mengumpulkan data leksikal dan mempersembahkannya dalam bentuk kamus. Oleh karena itu, berterima jika leksikograi diartikan sebagai cabang ilmu bahasa yang mempelajari teknik penyusunan kamus. Adapun deinisi kamus juga banyak dikemukakan oleh para akhi. Salah satunya adalah Kridalaksana (1985), mendeinisikan kamus sebagai buku referensi yang memuat daftar kata atau gabungan kata dengan keterangan mengenai berbagai segi maknanya dan penggunaannya dalam bahasa; biasanya disusun menurut abjad (dalam tradisi Yunani-Romawi menurut urutan abjad Yunani-Romawi), kemudian menurut abjad bahasa bersangkutan; dalam tradisi Arab menurut urutan jumlah konsonan. Pembuatan kamus dapat dilakukan dengan berbagai cara. Dalam penelitian ini menggunakan software Lexique Pro. Lexique Pro is an interactive lexicon viewer, with hyperlinks between entries, category views, dictionary reversal, search, and export tools. It can be conigured to display your Toolbox/Shoebox database in a user-friendly format so that you can distribute it to others (http://www-01.sil.org/computing/catalog/show_ software.asp?id=92). Pemakaian Lexique Pro ini karena Lexique Pro merupakan penampil leksikon interaktif, dengan sistem hyperlink antara entri, tampilan kategori, pembalikan kamus, pencarian, dan alat-alat ekspor dalam bentuk kamus cetak ataupun kamus online. Hal ini dapat dikonigurasi untuk menampilkan database dalam format yang sederhana dan memudahkan sehingga pengguna Lexique Pro dapat mendistribusikannya kepada orang lain. 184 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 184 8/2/16 11:20 AM 2.2 Metode Penelitian Analisis data yang digunakan yakni metode deskriptif kualitatif yang terdiri atas tiga proses yakni reduksi data, penyajian data, dan penarikan simpulan. Penelitian kualitatif menurut Moleong (2007:6) adalah penelitian yang bermaksud untuk memahami fenomena tentang apa yang dialami oleh subjek penelitian misalnya perilaku, persepsi, motivasi, tindakan, tuturan, dan lainnya secara holistik, dan dengan cara deskripsi dalam bentuk katakata dan bahasa, pada suatu konteks khusus yang alamiah dan dengan memanfaatkan berbagai metode alamiah. Data yang disajikan dalam pembahasan hanya data sampel berupa 30 data sebagai contoh bentuk kamusnya. Penelitian ini menggunakan software atau alat Leksikograi berupa Lexique Pro Versi 3.6. Lexique Pro merupakan software atau alat untuk membuat kamus dengan berbagai pilihan bahasa bahkan bahasa daerah. Penelitian ini menggunakan bahasa Indonesia sebagai bahasa sumber dan bahasa Jawa sebagai bahasa untuk pendeinisian atau pengartian. Wujud Lexique Pro dapat dilihat pada gambar berikut ini. Gambar tersebut adalah tampilan awal Lexique Pro. Kemudian pengguna bisa mengatur bahasa-bahasa yang akan digunakan sesuai kebutuhan. Karena penelitian ini adalah redesain bahasa Jawa maka bahasa yang digunakan adalah bahasa Indonesiabahasa Jawa dan akan muncul pada contoh berikut. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 185 185 8/2/16 11:20 AM Setelah data-data sudah dimasukan sesuai dengan kodenya, misal gn berarti gloss, lx berarti lexeme, dn berarti devinition, dan lainnya. Yang menentukan jenis dan banyaknya kode-kode itupun pengguna Lexique Pro karena penggunalah yang mengatur apa saja yang akan ada dalam kamus yang sedang dibuatnya. Setelah proses pemasukan data kemudian data-data dalam Lexique Pro itu bisa diekspor atau diubah dalam bentuk kamus cetak (dokumen) atau kamus online. III. ANAlISIS PeNelITIAN Desain berarti kerangka bentuk (KBBI, 2007). Redesain berarti membangun kembali suatu kerangka bentuk, dalam hal ini kerangka bentuk kamus bahasa Indonesia-bahasa Jawa atau sebaliknya. Kamus yang sudah ada biasanya hanya menunjukkan arti kata dalam bahasa yang dituju, misalnya ketika ingin mencari kata ‘makan’ dalam kamus bahasa Indonesia-bahasa Jawa maka akan muncul ‘mbadhog, mangan, maem, dahar’, atau kata ‘depan’ dalam bahasa Indonesia akan diartikan ke dalam bahasa Jawa di dalam kamus menjadi kata ‘arsa, ngarsa, andhap’. Jika kasus yang ada semacam itu, pengguna kamus akan merasa bingung ketika akan menggunakan bahasa Jawa yang santun sesuai tiga tingkatan bahasa Jawa. Oleh karena alasan di atas, perlulah diadakan redesain kamus yang ada dengan cara menambahkan keterangan tingkatannya sehingga pengguna kamus dan pengguna bahasa Jawa akan terbantu melalui kamus. Data-data mentah yang sudah didapat dari narasumber yang berupa empunya dan pengguna bahasa Jawa dengan tiga tingkatan akan diubah menjadi bentuk kamus. Dari 10 sumber data dapat diperoleh 430 kosakata yang dapat diuraikan tingkatan bahasa Jawanya. Di antara data-data mentahnya ialah 186 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 186 8/2/16 11:20 AM No 1 2 3 4 5 6 Bahasa Indonesia Pergi Perempuan Lupa Uang Mau Badan ... ... Bahasa Jawa Ngoko Lunga Wadon Lali Duwit Gelem Krama Madya Kesah Estri Supe Yatra Purun Awak Badhan ... Krama Inggil Tindak Estri Kalimengan Artha Kersa Salira ... ... Berdasar beberapa data mentah di muka, dapat diketahui bahwa tidak semua kata memiliki kosakata yang berbeda pada setiap tingkatan bahasa Jawanya. Hal tersebut wajar terjadi karena tidak semua kata memiliki kesantunan yang berdeda, akan tetapi ada beberapa kata yang memiliki tingkat kesantunan yang sama dengan tingkatan bahasa Jawa yang lain. Misalnya kata ‘estri’ dalam bahasa Jawa Krama Madya sama dengan bahasa Jawa Krama Inggil yang artinya adalah ‘perempuan’. Juga terjadi pada beberapa kata yang lain. Adapun contoh dalam bentuk kamus yang sudah diproses dengan Lexique Pro adalah sebagai berikut. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 187 187 8/2/16 11:20 AM 188 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 188 8/2/16 11:20 AM Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 189 189 8/2/16 11:20 AM Dalam contoh kamus yang berisi 30 lema tersebut dapat dilihat bahwa setiap kata memiliki kosakata masing-masing sesuai dengan tingkatan bahasa Jawanya meskipun ada beberapa yang kosakatanya sama. Selain itu juga terdapat deinisi yang bisa menjelaskan arti atau makna kata. Juga diberikan contoh kalimat dalam bahasa Indonesia sebagai bahasa sumber dan bahasa Jawa sebagai bahasa tujuan. Jika sebuah kamus dapat membantu para penggunanya, juga dapat memberi penjelasan mengenai arti kata dan penggunaannya, maka kamus juga akan menjadi sumber belajar yang memadai untuk dimiliki dan juga untuk terus dikembangkan. Kamus juga merupakan hasil dokumentasi mengenai bahasa yang dimiliki oleh suatu masyarakat, terlebih kamus bahasa daerah sehingga dapat dikatakan pembuatan kamus sama dengan proses pelestarian suatu bahasa daerah. Penggunaan bahasa Jawa dengan tiga tingkatan (bahasa Jawa Ngoko, Krama Madya, dan Krama Inggil) merupakan warisan budaya berbahasa pasa masyarakat Jawa. IV. SIMPulAN Dari 430 data yang sudah diidentiikasi berdasarkan tingkatan bahasa Jawanya, ternyata tidak semua kosakata yang memiliki tingkatan bahasa Jawa itu berbeda sesuai tingkatannya, tetapi ada beberapa kata yang sama. Misal kata ‘estri’ dalam bahasa Jawa Krama Madya sama dengan bahasa Jawa Krama Inggil yang artinya adalah ‘perempuan’. Faktanya, lebih banyak jumlah kosakata yang berbeda setiap tingkatan bahasa Jawanya. Pemberian tiga tingkatan bahasa Jawa dalam kamus bahasa Jawa-bahasa Indonesia atau sebaliknya dapat membantu pengguna kamus dan pengguna bahasa Jawa juga merupakan suatu sarana pembelajaran serta pelestarian bahasa daerah di Indonesia. 190 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 190 8/2/16 11:20 AM daftar Pustaka Alwi, Hasan. 2007. Kamus Besar Bahasa Indonesia. Jakarta: Balai Pustaka. Blount, B. G. (ed). 1974. Language Culture and Society. Cambridge: Winthrop. http://www-01.sil.org/computing/catalog/show_software.asp?id=92 (diunduh tanggal 10 Juli 2016 pukul 13:00 WIB) Kridalaksana, Harimurti. 1985. Tata bahasa deskriptif bahasa Indonesia: Sintaksis. Jakarta: Pusat Pembinaan dan Pengembangan Bahasa Departemen Pendidikan dan Kebudayaan. Moleong, L. J. 2007. Metodologi Penelitian Kualitatif. Bandung: PT Remaja Rosdakarya Offset. Ngadiman, Agustinus. 2006. Tingkat Tutur Bahasa Jawa: Wujud Kesantunan Manusia Jawa (Dulu dan Sekarang). Situs Sutresna Jawa: http://ki-demang.com/kbj5/index.php/ makalah-kunci/1132-09-tingkat-tutur-bahasa-jawa-wujud-kesantunan-manusia-jawa Nugroho, G. Setyo, dkk. (Tanpa Tahun). Tatanan Anyar PINTER BASA JAWI PEPAK. Surabaya: CV Pustaka Agung Harapan. Sariyan, Awang. 2014. Teras Pendidikan Bahasa Melayu. Selangor: PTS Malaysia. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 191 191 8/2/16 11:20 AM 192 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 192 8/2/16 11:20 AM lema Budaya: Ketersebaran dan Keterwakilan Semantis Ahmad Fadly Universitas Muhammadiyah Jakarta [email protected] Abstrak Kemajuan suatu bahasa tercermin dari kekayaan kosakata sehingga tidak terdapat celah atau kekosongan leksikal, baik pada bidang iptek maupun budaya. Dalam konteks Indonesia kekayaan itu diukur dari jumlah dan kelengkapan lema (entri) yang bersumber—salah satunya—dari kontribusi bahasa daerah mengingat bahwa bahasa-bahasa daerah di Indonesia sangatlah kaya akan budaya. Meskipun demikian, kenyataannya lema budaya KBBI masih didominasi oleh serapan dari kosakata dan ungkapan asing. Dalam penyusunan KBBI, terutama terkait dengan lema budaya, perlu diambil beberapa langkah berikut. Pertama, penyusunan korpus bahasa daerah tidak hanya terpusat di pulau atau masyarakat Jawa, tetapi juga tersebar ke seluruh wilayah Indonesia yang memiliki bahasa daerah. Kedua, data berupa kosakata yang terkumpul dari berbagai bahasa daerah itu dikelompokkan berdasarkan unsur budaya (organisasi sosial, sistem mata pencaharian, sistem pengetahuan, teknologi, religi, kesenian, dan sistem bahasa). Ketiga, kosakata budaya yang telah dikelompokkan dari berbagai daerah itu diidentiikasi berdasarkan kesamaan makna, jika ditemukan dua atau lebih kosakata dari daerah yang berbeda, tetapi bereferen atau berkonsep sama, dipilih salah satunya yang paling populer. Keempat, jika kedua atau lebih kosakata itu memiliki tingkat kepopuleran yang sama, dipilih yang paling tepat berdasarkan sistem fonologis bahasa Indonesia. Terakhir, masukkan istilah budaya yang belum tercakup dalam KBBI sebagai entri baru. Oleh karena itu, dalam penyusunan KBBI perlu dikedepankan aspek ketersebaran dari berbagai bahasa daerah dan keterwakilan semantis. Langkah itu dapat memperkaya kosakata bahasa Indonesia sekaligus menjadi cerminan budaya Indonesia yang heterogen. Kata Kunci: lema budaya, ketersebaran, keterwakilan semantis Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 193 193 8/2/16 11:20 AM I. PeNdAHuluAN 1.1. latar Belakang Indonesia mempunyai potensi jumlah bahasa daerah yang sangat besar. Penelitian Summer Institute of Linguistics (SIL) pada 2001 menyatakan bahwa bahasa daerah di seluruh Indonesia berjumlah 726 bahasa (Montolalu, et al. 2005). Sementara itu, jumlah bahasa daerah yang ada di Indonesia dan Papua Nugini sebesar 25% dari seluruh bahasa di dunia (Crystal 2003). Artinya, secara kuantitatif bahasa daerah di Indonesia mendominasi pada tataran global. Kenyataan itu mencerminkan kekayaan dan keanekaragaman budaya daerah yang patut disyukuri. Rosidi pernah menyatakan bahwa bahasa dan kebudayaan daerah merupakan suatu realitas yang menjadi modal untuk meningkatkan derajat bangsa (Rosidi 1995). Meskipun demikian, bahasa daerah—juga budayanya—itu dapat punah. Kepunahan bahasa daerah itu dinyatakan oleh Tondo (2009) disebabkan oleh sepuluh faktor, yaitu faktor ekonomi, migrasi, perkawinan antaretnik, bencana alam dan musibah, kondisi masyarakat yang bilingual atau multilingual, globalisasi, pengaruh bahasa mayoritas, kurangnya penghargaan terhadap bahasa etnik sendiri, kurangnya intensitas komunikasi berbahasa daerah, dan dimensi sosial politik bahasa Indonesia. Kesepuluh penyebab kepunahan bahasa daerah itu sebenarnya dapat diantisipasi dengan penguatan bahasa daerah melalui pengintegrasian kosakata budaya daerah ke dalam Kamus Besar Bahasa Indonesia (KBBI). Pengintegrasian tersebut tidak hanya berasal dari bahasa daerah yang memiliki jumlah penutur besar, tetapi juga dari bahasa daerah yang memiliki jumlah penutur terbatas. Dengan kata lain, penyusun KBBI perlu mempertimbangkan aspirasi budaya tiap-tiap masyarakat di Indonesia, tidak sebatas melihat budaya masyarakat mayoritas yang berada di kota besar. Dengan mempertimbangkan budaya daerah dari seluruh masyarakat itu, KBBI akan memiliki kekayaan lema sekaligus mencerminkan kekayaan kebudayaan Indonesia yang termanifestasi dalam lema-lemanya. 1.2. Masalah Sebagai dokumentasi bahasa, KBBI diharapkan memayungi bahasa-bahasa daerah di Indonesia. Namun kenyataannya, lema (entri) yang bersumber dari bahasa daerah pada KBBI Edisi IV pun justru sangat minim. Jumlah lema yang berasal dari kata dan ungkapan bahasa daerah pada kamus itu hanyalah 86 lema. Jumlah itu jauh lebih sedikit jika dibandingkan lema yang berasal dari kata dan ungkapan asing yang sebanyak 2.204 lema (Macaryus 2010). Ironis. 194 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 194 8/2/16 11:20 AM 1.3. Tujuan Pada hakikatnya, pemasukan lema yang berasal dari kata dan ungkapan daerah memberikan ruang gerak bagi budaya daerah untuk berkembang di Indonesia. Kosakata daerah yang dijadikan lema ke dalam KBBI mampu memperkenalkan budaya daerahnya kepada masyarakat Indonesia melalui pengguna KBBI sehingga nantinya kosakata bahasa Indonesia mampu mencerminkan keragaman kebudayaan Indonesia secara holistik. Pada praktiknya tentu tidak semua kosakata daerah dijadikan lema KBBI. Kosakata daerah yang berkategori budayalah yang dijadikan lema KBBI karena kosakata itu berpeluang untuk dapat berkontribusi dalam memperkaya khazanah kebudayaan Indonesia. 1.4. Tinjauan Pustaka Berbagai kritik, masukan, bahkan penelitian terkait dengan KBBI Edisi IV pernah dilakukan. Macaryus (2009) telah melontarkan kritikan sekaligus memberikan masukan yang sangat berharga terkait dengan KBBI Edisi IV. Berbagai kritikan itu mencakup ketidaktaatasasan dalam proses morfologis, inkonsistensi penentuan lema dan sublema, kerancuan bentuk baku dan tidak baku, ketidakkonsistenan dalam menyerap kata, serta ketidakakuratan data kabupaten/kota di Indonesia dan Hari Besar Nasional. Sementara itu, masukan yang ia berikan terkait dengan pendeinisian lema. Ia memandang bahwa penggunaan deinisi dengan negator tidak sebaiknya dihindari, tetapi diletakkan pada alternatif terakhir setelah deinisi yang lainnya. Selain itu, ia juga memberikan masukan yang berhubungan dengan pengembangan ungkapan dan peribahasa melalui pemanfaatan fenomena-fenomena kontekstual dan aktual. Cara itu dilakukan agar generasi muda memanfaatkan peribahasa sebagai dasar berpikir, bersikap, dan bertindak, sekaligus menjadi kontrol yang mengarahkan pada terbentuknya perilaku dan budaya tertentu. Adapun penelitian yang berhubungan dengan KBBI edisi IV pernah dilakukan oleh Supriyanti (2012). Hasil penelitiannya menunjukkan adanya pengaruh stereotip dalam penyusunan deinisi (termasuk contoh penggunaan lema) serta pada kemunculan lema dan sublema. Dalam penelitiannya juga ditemukan jenis oposisi gender dan pola pendeinisian lema yang beroposisi gender itu. Pada makalah ini, penulis memandang bahwa ancaman kepunahan bahasa daerah perlu direspons secara serius karena punahnya bahasa daerah berarti berkurang pula kekayaan kebudayaan Indonesia. Salah satu upaya mengatasinya adalah dengan pengentrian sekaligus pengintegrasian kosakata budaya bahasa daerah itu ke dalam lema KBBI yang bermuara pada pengayaan kosakata bahasa Indonesia. II. KerANgKA TeorI dAN MeTode PeNelITIAN Idealnya, sebuah kamus besar memiliki lema yang lengkap. Lema itu berupa morfem dasar, baik yang bebas, seperti batu, pergi, dan pulang, maupun yang terikat, seperti Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 195 195 8/2/16 11:20 AM juang, henti, dan abai (Chaer 2007). Pada kamus ekabahasa, kelengkapan tersebut menggambarkan kekayaan kosakata bahasanya. Dalam konteks Indonesia, kamus besar yang standar adalah KBBI. KBBI memiliki lema yang lebih lengkap dibandingkan dengan kamus-kamus ekabahasa lain di Indonesia sehingga dapat dijadikan acuan dalam penyusunan kamus-kamus lain yang sifatnya terbatas. Sebagai perbandingan, KBBI edisi terakhir (Edisi IV) memuat lebih dari 90.000 lema, sedangkan Kamus Umum Bahasa Indonesia (KUBI) karya W.J.S. Poerwadarminta hanya memuat sekitar 22.000 lema (Sulaiman 2009). Keunggulan KBBI dari segi jumlah lema tidak terlepas dari banyaknya ungkapan dan kosakata asing yang diserap di dalamnya. Memang Johnson, sebagaimana dikutip oleh Chaer (2007) pernah menyatakan bahwa fungsi sebuah kamus adalah untuk menjaga kemurnian bahasa. Namun, anggapan preskriptif itu tidak lagi sesuai dengan realitas kini dengan intensitas komunikasi yang tinggi antarmasyarakat tutur. Saat ini penyerapan kata atau kelompok kata dari bahasa asing merupakan suatu keniscayaan. Demikian pula penyerapan dari bahasa daerah ke dalam lema, terutama terkait dengan budaya. 2.1 lema Budaya Dengan hanya berjumlah 86 lema yang berasal dari kosakata dan ungkapan daerah, sebagaimana telah disebutkan oleh penulis pada bagian awal, KBBI hanya menunjukkan kebudayaan Indonesia secara parsial. Untuk itu, pengentrian kosakata budaya daerah mutlak dilakukan. Dalam pengentriannya, penyusun perlu mengelompokkan katakata berkategori budaya yang akan dijadikan lema. Terkait dengan itu, beberapa ahli mempunyai pendapat yang beragam ikhwal kategori budaya. Kroeber dan Kluckhohn, sebagaimana dikutip oleh Georgas (2003) menyatakan bahwa Culture consists of patterns, explicit and implicit and for behavior acquired and transmitted by symbols, constituting the distinctive achievements of human groups, including their embodiments in artefacts: the essential core of culture consists of traditional (i. e. historically derived and selected) ideas and especially their attached values; cultural system may on the one hand be considered as products of action, on the other as conditioning elements of further action”. Kategori budaya itu bersifat umum sehingga belum aplikatif. Sementara itu, Newmark mengelompokkan kategori budaya menjadi lima, yaitu budaya ekologis, budaya material, budaya sosial, organisasi sosial, dan kial serta tradisi (Newmark 1988). Budaya ekologis mencakup lora, fauna, pegunungan, dataran, dsb.), sedangkan budaya material mencakup artefak, makanan, pakaian, rumah, kendaraan, dan alat transportasi serta komunikasi. Sementara itu, budaya sosial mencakup pekerjaan dan kesenangan. Berbeda dengan budaya sosial, organisasi sosial mencakup adat istiadat, kegiatan adat, prosedur, konsep, agama, dan estetika. Adapun kial merupakan bahasa tubuh yang mengandung makna dan tradisi merupakan kebiasaan khas yang sering dilakukan oleh masyarakat. 196 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 196 8/2/16 11:20 AM Senada dengan Newmark, Hoed menyatakan bahwa dilihat dari segi perwujudannya terdapat tujuh unsur budaya yakni organisasi sosial, sistem mata pencaharian, sistem pengetahuan, teknologi, religi, kesenian, dan sistem bahasa (Hoed 2006). Batasan Hoed itu lebih komprehensif sekaligus aplikatif sehingga dapat dijadikan acuan dalam penyusunan KBBI, terutama dalam pemasukan kata berkategori budaya daerah. 2.2 Metode Penelitian Pada penelitian ini digunakan metode deskriptif kualitatif. Artinya, penulis menggambarkan kondisi KBBI Edisi IV dari segi lema dan sublema yang terkandung di dalamnya dari berbagai ulasan mengenai kamus itu. Selain itu, penulis menawarkan tahap penyusunan KBBI yang bersumber dari kosakata budaya daerah. III. ANAlISIS PeNelITIAN Kamus berperan penting dalam berbagai aspek kehidupan. Untuk itu, penyusun kamus dituntut memiliki wawasan yang luas, integritas yang tinggi, dan ketelitian. Ketelitian itu tercermin dari ketaatasasannya dalam mengikuti tahap penyusunan kamus. 3.1. Tahap Penyusunan Kamus Beberapa pakar menawarkan tahap penyusunan kamus. Secara umum, Ginzburg, et al. (1979) menyatakan bahwa tugas penyusun kamus mencakup tiga tahap, yaitu mengumpulkan data, menyeleksi dan menetapkan lema, dan menyusun tiap-tiap lema. Secara khusus, Chaer (2007) mengusulkan prosedur penyusunan kamus ke dalam sepuluh tahap, yaitu persiapan, pengumpulan data, pengabjadan, pengolahan data, penyusunan kartu naskah, pengetikan naskah, koreksi naskah, cetak coba, koreksi cetak coba, dan reproduksi naskah. Pada tahap persiapan, penyusun menentukan tujuan kamus yang akan disusun: kamus ekabahasa, dwibahasa, atau aneka bahasa beserta sasaran dan ukuran kamus tersebut. Pada tahap ini, penyusun menyiapkan alat tulis yang diperlukan, menyediakan atau mempersiapkan korpus data, menyediakan sumber rujukan, dan melakukan studi kelayakan. Pada tahap pengumpulan data, penyusun menuliskan setiap data, nama pengumpul data, dan sumbernya dalam satu kartu. Kemudian, pada tahap pengabjadan kartu data, penyusun menempatkan setiap data berdasarkan urutan abjad. Pengabjadan itu dilakukan secara vertikal dan horisontal. Secara vertikal artinya menempatkan kata dasar yang berawalan huruf a di atas kata yang berawalan huruf b, menempatkan kata yang berawalan huruf b di atas kata yang berawalan huruf c, dan seterusnya. Sementara itu, secara horisontal berarti jika ditemukan dua buah kata dasar yang memiliki huruf pertama yang sama, huruf kedualah yang diurutkan berdasarkan abjad, demikian pula seterusnya. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 197 197 8/2/16 11:20 AM Pada tahap berikutnya, penyusun mengolah data. Pada tahap ini penyusun melakukan empat pekerjaan sekaligus, yaitu menyeleksi ulang urutan abjad data, menandai suku kata, memberi makna, dan memberi label-label penjelas. Tahap selanjutnya, penyusun mulai menyusun kartu naskah. Pada tahap ini, penyusun memeriksa kartu-kartu yang telah diolah, lalu mengelompokkan lema dan sublema. Adapun pada tahap pengetikan naskah, penyusun mengetik naskah kamus berdasarkan kartu naskah yang telah disusun secara alfabetis, diberi makna deinisi, dan keteranganketerangan lain. Setelah itu, naskah dikoreksi kata per kata, sekaligus disusun naskah kata pengantar yang berisi pedoman penggunaan kamus serta berbagai petunjuk terkait dengan kamus tersebut, lalu dicetak coba. Kemudian, cetakan itu dikoreksi untuk mendapatkan hasil yang sempurna. Setelah berbagai tahap tersebut dilalui, penyusun memproduksi kamus untuk dipublikasikan dan dipasarkan. Tahapan yang ditawarkan oleh Ginzburg, et al. dan Chaer di atas bersifat normatif dan berlaku untuk penyusunan kamus secara umum. Oleh karena itu, penulis mengusulkan tahap penyusunan KBBI yang terkait dengan budaya dan dilandasi oleh semangat pelestarian bahasa-bahasa dan budaya daerah di Indonesia 3.2 Tahap Penyusunan lema Budaya: Ketersebaran dan Keterwakilan Semantis Sesuai dengan semangat Sumpah Pemuda yang meletakkan kedudukan bahasa Indonesia sebagai bahasa nasional sekaligus pemersatu, maka dalam penyusunan KBBI juga perlu dikedepankan prinsip kesetaraan sehingga kosakata bahasa Indonesia tidak hanya didominasi oleh bahasa daerah tertentu, tetapi juga diberikan peluang ketersebaran geograis. Untuk itu, perlu diletakkan kedudukan setiap bahasa daerah secara setara. Dalam penentuan korpus, setiap bahasa daerah diberikan kemungkinan yang sama sebagai bakal lema KBBI. Meskipun demikian, tidak berarti semua kata budaya dari seluruh bahasa daerah dimasukkan ke dalam lema. Jika ditemukan dua kata budaya atau lebih dari bahasa daerah yang berbeda, tetapi mengacu pada satu referen yang sama, cukup dipilih salah satunya. Pemilihan itu didasarkan pada dua hal, yaitu keterwakilan semantis dan kesamaan fonologis dengan bahasa Indonesia. Keterwakilan semantis maksudnya dari dua atau lebih kosakata budaya itu dipilih salah satunya yang lebih representatif atau populer (tolok ukurnya adalah yang paling banyak digunakan di berbagai kesempatan: bahasa lisan ataupun tertulis). Jika dua kata atau lebih itu sama-sama popoler, pilihlah yang sesuai dengan kaidah fonologis bahasa Indonesia. Sebagai contoh: kata peyeum (bahasa Sunda) dan tape (bahasa Jawa) mengacu pada referen yang sama. Untuk menentukannya ke dalam lema KBBI, dipilih yang lebih populer. Namun jika keduanya sama populer, dipilih yang sesuai dengan kaidah fonologis bahasa Indonesia. Kata peyeum tidak sesuai dengan kaidah fonologis bahasa Indonesia karena dalam sistem bunyi bahasa Indonesia tidak dikenal diftong eu. Sementara itu, kata tape lebih sesuai dengan sistem fonologis bahasa Indonesia karena semua fonem /t/, /a/, /p/, dan /e/ dikenal dalam sistem bunyi bahasa 198 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 198 8/2/16 11:20 AM Indonesia. Meskipun demikian, pengentrian kosakata berkategori budaya yang berasal dari bahasa daerah tetap harus disertai dengan pelabelan seperti Jw (Jawa), Sd (Sunda), Mn (Minang), dsb., yang menunjukkan bahwa lema tersebut berasal dari bahasa daerah. Dalam konteks pengentrian kosakata budaya daerah ke dalam KBBI, penulis menawarkan tahap penyusunnya yang digambarkan dalam diagram alur berikut. gambar 1. Tahap Pengentrian Kosakata Budaya ke dalam KBBI Pada tahap awal, penyusun KBBI perlu mengumpulkan data berbagai bahasa daerah dari berbagai sumber: lisan dan tulisan. Data kebahasaan dari sumber lisan digunakan mengingat bahwa tidak semua masyarakat daerah di Indonesia memiliki budaya literasi yang baik sehingga bahasanya tidak terdokumentasi secara tulis. Sementara itu, sumber data dari tulisan ditujukan untuk bahasa daerah yang terdokumentasi secara tulis. Data kebahasaan yang dikumpulkan itu (lisan dan tulisan) dibatasi tidak lebih dari satu tahun saat pengumpulan data. Tahap selanjutnya adalah pemilahan dan pengelompokkan kosakata berbagai bahasa daerah itu berdasarkan unsur budayanya. Pemilahan dan pengelompokkan itu mengacu pada ketujuh unsur budaya, sebagaimana yang ditawarkan oleh Hoed (2006), yakni organisasi sosial, sistem mata pencaharian, sistem pengetahuan, teknologi, religi, kesenian, dan sistem bahasa. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 199 199 8/2/16 11:20 AM Tahap berikutnya adalah penyandingan dua atau lebih kosakata yang berasal dari bahasa daerah yang berbeda, tetapi mengacu pada referen atau konsep yang sama. Cara itu dilakukan untuk memudahkan dalam memilih salah satu kosakata yang tepat untuk dijadikan lema agar nantinya tidak terjadi tumpang tindih dan kerancuan antarlema yang berakibat pada tidak efektif dan eisiennya KBBI. Tahap selanjutnya adalah pengujian kepupuleran. Jika ditemukan dua atau lebih kosakata dari bahasa daerah yang berbeda, penyusun perlu memilih salah satunya berdasarkan kepopulerannya. Untuk itu, penyusun perlu mentransliterasi sumber kebahasaan dari bahasa lisan untuk memudahkan dalam membandingkan antarkosakata yang bereferen atau berkonsep tunggal itu. Tahap terakhir yaitu penyesuaian dengan sistem fonologis bahasa Indonesia. Langkah ini diambil jika ditemukan bahwa terdapat dua atau lebih kosakata yang bereferen atau berkonsep tunggal dan memiliki tingkat kepopuleran yang sama. Dalam memilih salah satu kosakata untuk dijadikan lema perlu didasarkan pada kesesuaian dengan sistem fonologis bahasa Indonesia. IV. SIMPulAN KBBI termasuk kamus yang standar di Indonesia, tetapi masih didominasi oleh serapan bahasa asing. Kenyataan itu menunjukkan bahwa kosakata bahasa Indonesia justru tidak mencerminkan kebudayaan Indonesia. Untuk itu, perlu diambil langkahlangkah yang mengakomodasi kosakata daerah dengan memasukkannya ke dalam lema KBBI. Pengentrian kosakata daerah ke dalam KBBI lebih diutamakan yang berkategori budaya mengingat bahwa budaya daerah di Indonesia sangat kaya. Dalam pengentriannya, diklasiikasikan terlebih dahulu kosakata berkategori budaya, yaitu organisasi sosial, sistem mata pencaharian, sistem pengetahuan, teknologi, religi, kesenian, dan sistem bahasa. Setelah diklasiikasikan berdasarkan kategori budaya, perlu dikedepankan aspek ketersebaran dan keterwakilan semantis. 200 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 200 8/2/16 11:20 AM daftar Pustaka Chaer, Abdul. 2007. Leksikologi dan Leksikograi Indonesia. Jakarta: PT Rineka Cipta. Chaer, Abdul. 2013. Fonologi Bahasa Indonesia. Jakarta: PT Rineka Cipta. Crystal, David. 2003. Language Death. New York: Cambridge University Press. Georgas, James. 2003. “Cross-Cultural Psychology, Intelligence, and Cognitive Processes” dalam Culture and Children’s Intelligence: Cross-Cultural Analysis of WISC III. California: Elsevier Science. Ginzburg, et al.. 1979. A Course in Modern English Lexicology (Second Edition: Revised and Enlarged). Moskow: Vysšaja Škola. Hoed, Benny Hoedoro. 2006. Penerjemahan dan Kebudayaan. Jakarta: PT Dunia Pustaka Jaya. Macaryus, Sudartomo. 2010. “Kamus Besar Bahasa Indonesia Edisi IV: Beberapa Problem dan Kemungkinan Mengatasinya” dalam Peneroka Hakikat Bahasa. Yogyakarta: Universitas Sanata Dharma. Montolalu, Lucy Ruth, et al.. 2005. “Tipologi Bahasa dan Bahasa-Bahasa di Dunia” dalam Pesona Bahasa: Langkah Awal Memahami Linguistik. Jakarta: PT Gramedia Pustaka Utama. Newmark, Peter.1988. A Textbook of Translation. New York: Prentice Hall. Parera, Jos Daniel. 1986. Studi Linguistik Umum dan Historis Bandingan. Jakarta: Erlangga. Rosidi, Ajip. 1995. Sastera dan Budaya: Kedaerahan dalam Keindonesiaan. Jakarta: PT Dunia Pustaka Jaya. Supriyanti, Nanik. Praktik Leksikograi atas Nomina Persona Berorientasi Gender dalam Kamus Besar Bahasa Indonesia Edisi IV. Tesis pada Program Pascasarjana Program Studi Linguistik Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia. Depok: Tidak Diterbitkan. Tondo, Fanny Henry. 2009. “Kepunahan Bahasa-Bahasa Daerah: Faktor Penyebab dan Implikasi Etnolinguistis” dalam Jurnal Masyarakat dan Budaya Vol. 11 No. 2 Tahun 2009. Jakarta: P2KK-LIPI. Wierzbicka, Anna. 1997. Understanding Cultures Through Their Key Words: English, Russian, Polish, German, and Japanese. New York: Oxford University Press. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 201 201 8/2/16 11:20 AM 202 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 202 8/2/16 11:20 AM Mekanisme Pengolahan dan Penyajian Kosakata Budaya dalam Kamus Pemelajar BIPA Atin Fitriana, dien rovita, Totok Suhardijanto Universitas Indonesia Abstrak Kertas kerja ini menyajikan penanganan kosakata budaya dalam usaha penyusunan kamus BIPA yang hingga kini masih terus dilakukan di lingkungan Universitas Indonesia. Penjaringan data kosakata budaya dalam penelitian leksikograi ini dilakukan dengan menggunakan korpus BIPA yang disusun oleh Program BIPA LBI UI. Korpus elektronik BIPA yang berjumlah 1,5 juta kata tersusun dari kumpulan teks bahan ajar, percakapan guru dan siswa, soal tes, serta hasil karya pemelajar BIPA. Metode yang digunakan dalam penelitian ini merupakan gabungan dari metode dalam korpus linguistik, dalam hal penentuan dan pengolahan kosakatanya, dan metode leksikograi dalam hal penyajian entrinya. Pada makalah ini, fokus perhatian diberikan pada bagaimana penyusunan dan pendefinisan kosakata budaya dalam kamus pemelajar BIPA. Kriteria penentuan kosakata budaya dalam makalah ini didasarkan pada pemakaian kata sesuai dengan konteksnya yang ada di dalam korpus BIPA. Penggunaan kosakata budaya sebagai bagian dari penggunaan bahasa dapat memperlihatkan ciri sebuah budaya masyarakat tertentu. Sebuah kata dapat dikatakan sebagai kosakata budaya ketika kata tersebut menjadi khas dan menunjukkan karakteristik pola kehidupan sebuah kelompok masyarakat tertentu. Tentu saja, penyajian kosakata tersebut dalam kamus BIPA tidak cukup hanya dengan pemberian deinisi umum dan sinonimi, tetapi juga dengan pemberian contoh, gambar, dan deskripsi lain yang dapat membantu pemelajar BIPA memahaminya dengan lebih baik. Kata kunci: kosakata budaya, korpus BIPA, pengolahan, penyusunan, kamus pemelajar BIPA Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 203 203 8/2/16 11:20 AM I. PeNdAHuluAN 1. 1latar Belakang Kamus adalah istilah umum untuk bahan rujukan yang memuat perbendaharaan kata suatu bahasa yang disusun menurut tradisi abjad bahasa yang bersangkutan. Istilah ini kemudian meluas penggunaannya untuk menunjukkan bahan rujukan yang terbatas atas lebih teknis, misalnya kamus istilah, kamus singkatan, kamus kata-kata berirama, dsb, serta meluas menjadi kamus ensiklopedis, juga kamus monolingual bi- atau multilingual (Kridalaksana, 2003: xi). Kamus BIPA merupakan rujukan berisi perbendaharaan kosakata dalam bahasa Indonesia berikut makna yang terkandung di dalamnya, khususnya kosakata bahasa Indonesia yang digunakan oleh pemelajar BIPA dalam pembelajaran bahasa Indonesia serta dalam kehidupan sehari-hari. Berdasarkan hal tersebut, kamus BIPA harus mengandung kosakata yang tepat, berkaitan dengan kebutuhan para pemelajar BIPA. Kosakata tersebut dapat berupa kosakata dasar dan kosakata budaya. Kosakata budaya yang menjadi pokok pembicaraan dalam makalah ini dibatasi sebagai kosakata yang dalam penjelasannya tidak dapat dilakukan dengan sekadar menggunakan deinisi umum dan/atau sinonimi, tanpa memasukkan unsur-unsur konteks budaya setempat. Misalnya, kata sekaten yang dalam KBBI Edisi IV (2008) dijelaskan dengan “/sekatén/ n pasar malam (terutama di Yogyakarta dan Surakarta) yg diadakan tiap bulan Maulud (untuk merayakan Maulid Nabi Muhammad saw.).” Bagi pemelajar BIPA, tentu saja, hal ini tidak cukup membantu. Secara garis besar, terdapat beberapa tantangan dalam penyusunan kamus BIPA. Beberapa tantangan tersebut antara lain (1) seberapa besar jumlah kosakata dalam korpus yang akan dimasukkan ke dalam kamus, (2) bagaimana penentuan kosakata yang akan dimasukkan dan tidak akan dimasukkan ke dalam kamus, (3) bagaimana susunan lema dan sublema kamus, (4) bagaimana pendeinisan kosakata yang tepat untuk pengguna kamus. Terkait dengan tantangan terakhir, kamus yang disusun akan digunakan untuk pemelajar BIPA mulai dari tingkat dasar hingga mahir, sehingga yang termasuk di dalam persoalan tersebut adalah bagaimana pendeinisian atau pemberian informasi berkaitan dengan kosakata budaya, ungkapan, dan peribahasa. 1.2 Masalah Penelitian Saat ini pengajaran bahasa Indonesia sebagai bahasa asing cukup berkembang. Oleh karena itu kebutuhan terhadap materi ajar sangat besar. Kamus, sebagai sebuah buku yang berisi penjelasan mengenai kosakata dalam sebuah bahasa, juga sangat diperlukan dalam kegiatan pembelajaran. Oleh karena itu, kami merasa bahwa penyusunan kamus BIPA juga sangat diperlukan. 204 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 204 8/2/16 11:20 AM Penelitian ini merupakan salah satu kegiatan yang dilakukan dalam usaha penyusunan kamus yang masih terus dilakukan. Dalam penelitian ini, kami berfokus pada kosakata budaya yang akan dimasukkan dalam kamus BIPA, khususnya bagaimana pengolahan kosakata budaya yang diambil dari korpus BIPA yang telah dikumpulkan sebelumnya, berdasarkan kriteria tertentu, dan bagaimana penyajian kosakata yang telah ditentukan berdasarkan kriteria tertentu tersebut di dalam kamus, khususnya dengan melihat pendeinisian katanya. 1.3 Tujuan Penelitian Berdasarkan perumusan masalah di atas, makalah ini bertujuan untuk memberikan eksplanasi mengenai mekanisme pengolahan kosakata budaya berdasarkan korpus BIPA serta penyajian kosakata budaya tersebut di dalam kamus, khususnya penyajian deinisi kosakata budaya tersebut di dalam kamus. 1.4 Tinjauan Pustaka 1.4.1 Penelitian Leksikograi Dora Amalia (2014) dalam disertasinya membahas pendeinisian dan model entri verba dalam kamus pemelajar bahasa Indonesia. Dalam disertasi yang berjudul “Formulasi Pendeinisian dan Model Pengentrian Verba dalam Kamus Pemelajar Bahasa Indonesia”, Amalia (2014:2—3) menjelaskan bahwa dalam pengajaran BIPA penggunaan kamus tidak terintegrasi dengan baik dan tidak mendapat priortitas dalam pelajaran BIPA. Selain itu Amalia juga menambahkan bahwa kamus yang biasa digunakan oleh pemelajar BIPA adalah kamus dwibahasa yang biasanya berbentuk kamus elektronik. Dalam penyusunan sebuah kamus, bagian mikrostruktur kamus yang paling penting adalah entri, dan dalam menyusun entri pada kamus ekabahasa, deinisi merupakan bagian yang terpenting (Amalia, 2014:6-7). Oleh karena itu tujuan dari penelitian ini adalah untuk membuat formulasi pendeinisian dan membuat model pengentrian verba dalam kamus untuk pemelajar bahasa Indonesia. Penelitian ini menggunakan empat landasan teoretis. Teori yang pertama adalah teori modern fungsi leksikograis. Teori tersebut digunakan dalam perancangan dan penyusunan kamus dan pentingnya pengguna kamus dalam penyusunan kamus. Teori kedua yaitu teori leksikograi pedagogis. Teori ketiga yaitu teori semantik rangka. Teori keempat adalah teori tentang kolokasi yang digunakan dalam memilih dan menentukan informasi leksikograis. Metode yang digunakan dalam penelitian ini adalah metode campuran yaitu gabungan antara metode kuantitatif dan kualitatif. Di dalam penelitian ini, peneliti juga melakukan evaluasi kamus pemelajar bahasa Indonesia. Evaluasi kamus pemelajar tersebut, yaitu kamus pemelajar A Learner’s Comprehensive Dictionary of Indonesia (LCDI) dan The Learner’s Dictionary of Today’s Indonesian (LDTI). Kesimpulan yang diperoleh dari hasil evaluasi yang dilakukan Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 205 205 8/2/16 11:20 AM terhadap kedua kamus tersebut, yaitu LCDI lebih unggul dalam hal jumlah dan jenis lema. Selain itu, LCDI lebih memudahkan pengguna karena untuk tiap abjad menggunakan halaman baru. Sementara LDTI unggul pada aspek kebergunaan (dalam penyusunan entri, terdapat banyak penjelasan tanpa menggunakan banyak tanda atau kode). LDTI menjadikan bentuk derivasi sebagai lema tersendiri, sehingga memudahkan pengguna dalam mencari kata tanpa harus mencari kata dasarnya terlebih dahulu. Selain itu, LDTI juga menggunakan deinisi yang lebih kontekstual dibandingkan LCDI. Pada identiikasi karakteristik pengguna kamus pemelajar bahasa Indonesia, penelitian dilakukan dengan cara menetapkan proil pengguna dan riset kamus. Berdasarkan hasil wawancara, terdapat proil pengguna, yaitu tipe pengguna (dewasa, pemelajar bahasa, tingkat kemahiran menengah sampai mahir, dan kamus untuk keperluan belajar), tipe penggunaan (untuk keperluan acuan dan belajar bahasa), dan tingkat keterampilan pengguna (mempunyai pengetahuan kebahasaan yang memadai). Berdasarkan penelitian yang telah dilakukan, yaitu berdasarkan hasil wawancara, terdapat dua jenis deinisi yang paling banyak dipilih oleh partisipan dalam konteks reseptif, yaitu deinisi analitis dan deinisi kontekstual. Deinisi analitis adalah deinisi yang lazim dalam kamus, namun umumnya pertisipan lebih menyukai jenis deinisi yang berisi informasi sintaksis dalam bentuk pola valensi. Terdapat dua hal yang berkaitan dengan formulasi pendeinisian, yaitu pemilihan lema dan kosakata pendeinisi. Dalam penelitian yang dilakukan, pemilihan lema dan kosakata pendeinisi dilakukan menggunakan perhitungan frekuensi dan distribusi pemakaian kata di dalam korpus. Semakin tinggi frekuensi penggunaan kata, maka semakin penting kata tersebut dijadikan sebagai lema atau semakin besar kata tersebut dipahami dan layak digunakan sebagai kosakata pendeinisi. Dalam penelitian ini, Amalia (2014) mengusulkan deinisi singkat, yaitu berupa genus atau sinonim. Selain itu, untuk mempermudah mendapatkan informasi, penelitian ini mengusulkan untuk menuliskan deinisi singkat dengan jenis huruf yang berbeda, yaitu menggunakan huruf kapital bercetak tebal yang ukurannya lebih kecil satu ukuran dari jenis huruf dalam deinisi. Deinisi singkat dapat berupa satu atau dua kata, diberi nomor agar memudahkan pencarian, dan disusun berurutan ke bawah sesuai makna yang paling banyak ditemukan di dalam korpus. Sementara itu, peneliti mengusulkan deinisi kontekstual sebagai formulasi pendeinisian untuk konteks produk. Deinisi kontekstual tersebut disajikan dengan pola jika… berarti dalam kalimat lengkap. Selain itu, deinisi kontekstual juga dilengkapi dengan valensi. Adapun pola entri yang disajikan dalam penelitian ini, yaitu [lema/sublema] [/lafal/] [kelas kata] [label] [[runs on]] [nomor polisem] [DEFINISI SINGKAT] [deinisi lengkap] [(pola valensi)] [contoh kalimat]. Berdasarkan penelitian yang dilakukan, model pengentrian verba dalam kamus harus meliputi deinisi singkat dan ilustrasi. Untuk fungsi produktif, pengentrian verba didukung dengan informasi tentang lafal, informasi sintaksis (kelas kata dan pola valensi), contoh kalimat, kolokasi, dan catatan penggunaan. Adapun pola entri 206 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 206 8/2/16 11:20 AM verba dalam kamus tersebut direalisasikan dalam enam kategori verba, yang meliputi verba transitif berobjek, verba transitif berobjek dan berpelengkap, verba semitransitif, verba intransitif tak berpelengkap, verba intransitif berpelengkap, dan verba intransitif berpelengkap nomina dengan preposisi tetap. 1.4.2 Penelitian Leksikograi dan Korpus Penelitian leksikograi dengan metode korpus dilakukan oleh David Lindemann (2013). Dalam artikel yang berjudul “Bilingual Lexigraphy and Corpus Methods. The Example of German-Basque as Language Pair”, Lindemann (2013) melakukan penelitian leksikograi berbasis korpus dalam bahasa Jerman-Basque dan mendeskripsikan rancangan penelitian untuk kamus elektronik Jerman-Basque. Kamus tersebut merupakan kamus bahasa Basque bagi pemelajar bahasa Jerman. Pada penelitian leksikograi dengan menggunakan korpus khususnya pada dua bahasa, terdapat beberapa tahapan penelitian yang dilakukan. Langkah pertama yang dilakukan adalah dengan memasangkan bahasa yang memiliki populasi yang tinggi dengan populasi yang rendah. Bahasa Basque merupakan bahasa dengan populasi penggunaan yang rendah jika dibandingkan dengan bahasa Jerman. Populasi bahasa yang lebih kecil terhadap pasangan bahasa yang ditentukan dengan metode data paralel dapat dijadikan serta disusun untuk korpus terjemahan. Langkah kedua, yaitu dengan menyusun korpus bahasa Jerman-Basque yang baru. Terdapat sekitar 2 juta token tiap bahasa. Korpus tersebut disimpan dalam format TMX dan dimasukkan ke dalam peranti lunak SketchEngine. Pada bagian bahasa Jerman dilakukan lematisasi dan pembubuhan kelas kata (POS tagging) dengan menggunakan TreeTagger. Sementara itu, bahasa Basque diolah pada tahap tokenisasi saja. Langkah selanjutnya adalah mencari keterangan pada daftar lema berdasarkan korpus. Pada bahasa Jerman, daftar frekuensi lema pada korpora yang besar tersedia di bawah izin publik. Pada alur kerja, peneliti membandingkan DeReWo-40.000 daftar dengan meninjau kembali lema pada tiga kamus, menghapus, menggantikan, atau menambah lema secara manual. Langkah yang sama juga dilakukan dengan bahasa Basque, namun dengan beberapa catatan khusus. Langkah berikutnya, yaitu membuat naskah kamus semi otomatis. Peneliti mencoba dua perlengkapan pada metode statistik. Hasil yang paling baik dihasilkan melalui GermanNet/EuroWordNet dan Basque WordNet/MCR. Langkah pertama dengan mencoba menggabungkan 16.000 unit leksikal dalam bahasa Basque dan 10.200 unit leksikal dalam bahasa Jerman menjadi 8.500 kata. Selanjutnya, dilakukan penyuntingan entri pada kamus. Pada tahap ini, penyuntingan dilakukan dengan bantuan peralatan (tools) di dalam komputer dan juga kemampuan dari pembuat kamus. Langkah terakhir, yaitu dengan melihat konkordansi pada korpus sebagai bagian dari halaman hasil pada bagian pencarian entri di dalam kamus. Dengan menggunakan konkordansi, tidak hanya dapat melihat secara leksikal tetapi juga secara sintaksis. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 207 207 8/2/16 11:20 AM Pada pembuatan kamus elektronik bahasa Jerman-Basque, peneliti memperhatikan apa yang terjadi di negara Basque, yaitu bahasa Basque merupakan bahasa yang digunakan dalam pelajaran. Bagi bahasa Jerman yang merupakan bahasa asing di sana, buku teks didesain dan ditulis dalam bahasa Jerman dan bahasa Basque tanpa diterjemahkan ke dalam bahasa Spanyol atau Prancis. Guru bahasa Jerman di Basque mengajar menggunakan kamus monolingual, atau menggunakan kamus bahasa SpanyolJerman karena kamus tersebut lebih banyak memuat hal-hal berkaitan dengan makro dan mikrostruktur kamus dibandingkan kamus saku bahasa Jerman-Basque yang telah tersedia. Untuk mengisi kekosongan tersebut, peneliti membuat rancangan penelitian pembuatan kamus elektronik bahasa Jerman-Basque yang baru. Pada bagian makrostruktur, peneliti mulai dengan mengambil DeReWo-40.000 daftar kata dengan membandingkan tiga kamus bahasa Jerman, dan mendapatkan sampel sebanyak 4500 lema. Pengetahuan linguistik pembuat kamus, pengetahuan cara pembuatan kamus, korpus baru bahasa Jerman-Basque, dan beberapa kamus yang ada digunakan sebagai sumber untuk menyunting entri kamus. Pada eudelex, lema dalam bahasa Jerman ditampilkan pertama sebagai entitas sintaktis, polisemi disajikan pada level kedua beserta terjemahan bahasa Basque dengan padanan peta arti kata dalam bahasa Jerman. Sebagai itur tambahan, peneliti memperkenalkan konten versi permulaan tampilan web eudelex dari Wiktionary dan Wikipedia bahasa Jerman. Peneliti menjelaskan juga mengenai struktur entri dalam kamus berdasarkan TEI, yaitu terdiri atas informasi sintaksis dan semantik. Selain itu, polisemi juga hadir di dalam struktur entri kamus sebagai bagian dari sintaksis seperti “nomina”, “adjektiva”, “verba transitif”, “verba intransitif”, dan sebagainya. II. KerANgKA TeorI Sebagai landasan dasar dalam penelitian ini, pada bagian ini akan dijelaskan beberapa konsep yang dianut dalam tulisan ini. Konsep-konsep tersebut terkait dengan perihal kosakata budaya, serta kamus dan kerja perkamusan. 2.1 Kosakata Budaya Sebagai landasan dalam penentuan kosakata yang akan dimasukkan ke dalam kamus, digunakan klasiikasi unsur-unsur kebudayaan menurut Koentjaraningrat (1979) dan Duranti (2009). Budaya merupakan sesuatu yang dipelajari dan diturunkan dari generasi ke generasi, mulai dari tingkah laku, interaksi sosial, hingga komunikasi antarmanusia, dan menjadi karakteristik sebuah kelompok masyarakat tertentu (Duranti, 2009). Duranti (2009) menjelaskan makna budaya berdasarkan 6 hal, yaitu budaya sebagai perbedaan dari alam, budaya sebagai pengetahuan, budaya sebagai komunikasi, budaya sebagai sistem media/ alat, budaya sebagai sistem praktik, budaya sebagai sistem partisipasi. 208 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 208 8/2/16 11:20 AM Pada penjelasan budaya (culture) sebagai sesuatu yang berbeda dari alam (nature), Duranti (2009:25) menjelaskan pandangan Hegel, bahwa budaya merupakan sebuah proses pemisahan dari alam. Budaya berarti kemampuan untuk melangkah keluar dari sebuah batasan dan mengambil sudut pandang lain. Proses tersebut menjadikan pengetahuan tidak hanya sebatas dari pengetahuan sendiri tapi juga didapatkan dari pengetahuan luar. Budaya sebagai pengetahuan, Duranti (2009:27-28) menjelaskan budaya berdasarkan bahasa. Menurutnya, untuk mengetahui budaya sama seperti mengetahui sebuah bahasa, dan untuk menjelaskan budaya sama seperti menjelaskan bahasa. Selain itu, Duranti juga menjelaskan bahwa budaya sebagai distribusi pengetahuan sosial yang menitikberatkan bahwa proses pemahaman oleh masing-masing individu tidak sama dan tidak semua orang memiliki akses yang sama untuk informasi atau menggunakan teknik yang sama dalam mencapai tujuan. Budaya sebagai komunikasi berarti melihat budaya sebagai sebuah sistem tanda (Duranti, 2009:33). Budaya merupakan sebuah representasi dunia, sebuah cara untuk memahami realitas dalam menjelaskan cerita, dongeng, deskripsi, teori, proverba, produk artistik dan pertunjukan. Budaya sebagai sebuah sistem media/ alat berkaitan dengan kebutuhan manusia dalam mengontrol lingkungan, seperti hubungan manusia dengan makanan (garpu) dan manusia dengan cuaca (payung) (Duranti, 2009:39). Budaya sebagai sebuah sistem praktik, Duranti (2009:45) menjelaskan bahwa sebuah bahasa merupakan kumpulan dari praktik yang tidak hanya berhubungan dengan sistem kata dan gramatikal, tetapi juga kekuatan simbolik dari sebuah cara berkomunikasi, dengan beberapa sistem klasiikasi, tujuan dan bentuk referensi, leksikon, dan metafora. Budaya sebagai sebuah sistem partisipasi berkaitan dengan budaya sebagai sistem praktik dan didasarkan pada asumsi bahwa setiap tindakan di dunia, termasuk komunikasi verbal sebagai sifat sosial, kolektif, dan kualitas partisipatori. Sebagai contoh, bahasa merupakan bagian berbagai tindakan berbicara yang merupakan sebuah tindakan dari partisipasi pada sebuah komunitas pengguna sebuah bahasa (Duranti, 2009:46). Sementara itu, Koentjaraningrat (1979:203-204) membagi unsur kebudayaan menjadi tujuh, yaitu bahasa, kesenian, sistem religi, sistem teknologi, sistem mata pencaharian, organisasi sosial, dan sistem ilmu pengetahuan. Ketujuh unsur kebudayaan tersebut merupakan unsur kebudayaan yang universal, yaitu ada di setiap budaya. Tiap unsur kebudayaan tersebut dapat dibagi lagi menjadi beberapa bagian yang lebih terperinci. Bahasa dapat meliputi bahasa tulis dan bahasa lisan. Kesenian dapat meliputi seni musik, seni tari, seni sastra, dsb. Sistem religi dapat meliputi hal-hal yang berkaitan dengan kepercayaan dan upacara keagamaan. Sistem teknologi dapat meliputi alat-alat yang digunakan untuk memenuhi kebutuhan sehari-hari, seperti alat makan, senjata, pakaian. Sistem mata pencaharian dapat meliputi pekerjaan, seperti bertani, bercocok tanam, dan berdagang. Organisasi sosial dapat meliputi hal hal yang berkaitan dengan kekerabatan, perkumpulan, sistem kenegaraan. Sementara itu, sistem ilmu pengetahuan dapat meliputi hal-hal yang berkaitan dengan pengetahuan lingkungan (lora dan fauna) dan pengetahuan tentang manusia. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 209 209 8/2/16 11:20 AM Berdasarkan penjelasan mengenai unsur-unsur budaya tersebut, sebuah budaya dapat direpresentasikan melalui berbagai aspek, salah satunya melalui bahasa. Meskipun unsurunsur kebudayaan tersebut bersifat universal, namun terdapat ciri yang membedakan antara sebuah budaya masyarakat tertentu dengan budaya masyarakat lainnya. Sapir – Whorf dalam Jourdan dan Tuite (2006:35) menjelaskan bahwa struktur semantik pada berbagai bahasa yang berpegang pada cara penutur bahasa tersebut berpikir dan bertindak sesungguhnya tidak dapat dibandingkan satu sama lain. Bahasa, cara berpikir, dan budaya saling terhubung, sehingga masing-masing bahasa dapat memiliki asosiasi dengan sudut pandangnya tersendiri. Hal tersebut karena baik bahasa, budaya, serta cara pikir masyarakat pada kebudayaan tertentu memiliki ciri khas yang membedakannya dengan kebudayaan lain. Sebagai contoh, Jourdan dan Tuite (2006: 35-36) menjelaskan bahwa terdapat perbedaan kosakata warna pada masing-masing bahasa. Perbedaan kosakata warna tersebut dapat diperoleh dari penutur bahasa yang berbeda. Berdasarkan penjelasan Sapir-Whorf tersebut, penggunaan kosakata budaya sebagai bagian dari penggunaan bahasa dapat memperlihatkan ciri sebuah budaya masyarakat tertentu. Sebuah kata dapat dikatakan sebagai kosakata budaya ketika kata tersebut menjadi khas dan menunjukkan karakteristik pola kehidupan sebuah kelompok masyarakat. Adapun penggunaan kosakata budaya tersebut menjadi penting dalam menunjukkan identitas pengguna sebuah bahasa. 2.2. Kamus dan Kerja Perkamusan Dalam leksikograi atau pekerjaan perkamusan, ada beberapa langkah yang harus ditempuh yang mencakup penentuan siapa pengguna kamus, jenis kamus, serta penyajian isi kamus. Untuk memahami langkah-langkah dalam penyusunan kamus tersebut, pada bagian ini akan dijelaskan mengenai pengguna kamus, jenis kamus, mikrostruktur dan makrostruktur kamus, serta pendeinisian kamus. Berdasarkan penggunaanya, pada umumnya, kamus digunakan sebagai referansi untuk mencari makna sebuah kata, khususnya untuk kebutuhan menulis. Untuk kebutuhan berbicara dan menyimak, kamus juga digunakan untuk memeriksa pelafalan. Selain itu, kamus juga dapat digunakan untuk melihat struktur gramatika sebuah bahasa, etimologi sebuah kata, atau informasi mengenai bunyi sebuah kata (Bogaards, 2003:26—27). Hal yang juga menjadi bahan pertimbangan di dalam menyusun sebuah kamus adalah pengguna kamus. Terdapat beberapa jenis pengguna kamus. Berdasarkan usianya, pengguna kamus dapat dibedakan atas orang dewasa, anak-anak, atau remaja. Pengguna kamus juga dapat dibedakan atas penutur jati sebuah bahasa atau pemelajar sebuah bahasa. Pengguna kamus juga dapat dibedakan atas pengguna bahasa secara umum atau secara khusus beradasarkan bidang-bidang tertentu (Atkins dan Rundell, 2008: 28—29). Kamus dapat dibedakan atas beberapa jenis. Atkins dan Rundell (2008: 24—25) mengelompokkan kamus berdasarkan beberapa hal sebagai berikut. 210 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 210 8/2/16 11:20 AM (1) Berdasarkan jumlah bahasanya, kamus dapat dibedakan atas kamus monolingual, kamus bilingual, dan kamus multilingual. (2) Berdasarkan cakupan isinya, kamus dapat dibedakan atas kamus umum, kamus ensiklopedis, kamus khusus (misalnya kamus istilah hukum, kamus istilah olahraga cricket, kamus istilah keperawatan, dll.), serta kamus yang berisi pemakaian bahasa secara khusus (misalnya kamus kolokasi, peribahasa, idiom, dan lain-lain). (3) Berdasarkan ukurannya, kamus dapat dibedakan atas kamus standar, kamus ringkas, kamus saku. (4) Berdasarkan medianya, kamus dapat dibedakan atas kamus dalam bentuk cetak, kamus dalam bentuk elektronik, dan kamus dalam bentuk web-based. (5) Berdasarkan pengorganisasiannya, kamus dapat dibedakan atas kamus yang disusun dengan urutan kata lalu artinya dan kamus yang disusun dengan urutan kata, arti, kemudian kata. (6) Berdasarkan pengguna kamusnya, kamus dapat dibedakan atas kamus yang digunakan oleh pengguna kamus yang menggunakan bahasa yang sama, kamus yang digunakan oleh dua kelompok yang menggunakan dua bahasa yang berbeda, serta kamus yang digunakan oleh pengguna kamus dari seluruh dunia. (7) Berdasarkan kemahiran penggunanya, kamus dapat dibedakan atas kamus yang digunakan oleh linguistis atau profesional, kamus yang digunakan oleh orang dewasa yang terpelajar, kamus yang digunakan oleh pelajar sekolah, kamus yang digunakan oleh anak-anak, dan kamus yang digunakan oleh orang yang mempelajari sebuah bahasa. (8) Berdasarkan tujuan penggunaan kamus, kamus dapat dibedakan atas kamus untuk tujuan decoding, yaitu kamus digunakan untuk memahami makna sebuah kata dan digunakan untuk menerjemahkan sebuah teks dari bahasa asing ke bahasa sasaran dan kamus juga digunakan untuk tujuan encoding, yaitu kamus digunakan untuk memeriksa penggunaan kata yang kurang tepat, untuk menerjemahkan sebuah teks ke bahasa sasaran, kemudian ke bahasa asing lain, serta untuk mengajar sebuah bahasa. Kridalaksana (2003: xiii--xiv) menyatakan bahwa mikrostruktur kamus berkaitan dengan susunan lema dalam entri kamus, termasuk artikel dalam ensiklopedia. Mikrostruktur kamus terdiri atas bagian inti dan bagian pelengkap. Pada bagian inti terdapat lema atau kata kepala, sedangkan pada bagian pelengkap terdapat kelas kata, sublema dengan informasinya, contoh, derivasi dan inleksi, lafal, variasi historis sosial dan geograis, gaya bahasa, konteks penggunaan bahasa, sinonim dan antonim, serta etimologi. Sementara itu, makrostruktur kamus berkaitan dengan susunan entri di dalam kamus, yakni yang berkaitan dengan susunan abjad, rujuk silang, kata majemuk dan gabungan leksem yang idiomatis atau bukan, tipograi, gambar atau diagram sebagai ilustrasi, serta petunjuk penggunaan kamus. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 211 211 8/2/16 11:20 AM Di dalam mikrostruktur kamus, terdapat lema beserta informasinya, khususnya deinisi. Di samping lema, deinisi merupakan bagian penting di dalam kamus. Atkins dan Rundell (2008: 407) membedakan dua hal dalam pendeinisian kosakata, yaitu reference atau decoding dan productive atau encoding. Penyusunan deinisi kosakata yang dilakukan untuk tujuan decoding adalah jika pengguna kamus yang akan disusun melihat deinisi tersebut karena ia menemukan sebuah kata asing dan perlu mengetahui artinya. Sementara itu, penyusunan deinisi kosakata yang dilakukan untuk encoding adalah jika pengguna kamus yang disusun ingin menulis atau mengatakan sesuatu dengan kosakata tersebut, dan ini termasuk encoding dari maksud yang ada dalam pikirannya dengan cara yang natural, sesuai, dan efektif. Berdasarkan penjelasan tersebut dapat dilihat bahwa jika pengguna kamus hanya ingin mengetahui arti sebuah kosakata yang asing untuknya, pendeinisian sebuah kosakata dapat dilakukan dengan lebih sederhana. Sebaliknya, jika pengguna ingin mengetahui arti sebuah kosakata untuk digunakan, baik dalam lisan maupun tulisan, pendeinisian sebuah kosakata tidak hanya memperhatikan konteks pemakaian kosakata, tetapi lebih jauh lagi juga memperhatikan kaitannya dengan semantik, kolokasi, sosiolinguistik, dan pragmatik. Berkaitan dengan pendeinisian, Atkins dan Rundell (2008: 413—422) menjelaskan beberapa jenis pendeinisian dalam kamus, antara lain deinisi dengan model tradisional, prototipe, dan sinonim. Deinisi dengan model tradisional mengandung dua unsur deinisi, yaitu kata superordinat dan informasi tambahan. Kata superordinat merupakan bagian dalam deinisi berupa kategori semantis, sedangkan informasi tambahan merupakan bagian dalam deinisi yang berisi penjelasan yang bersifat membedakan satu kata dengan kata lain yang berasal dari kategori yang sama (kohiponimnya). Deinisi model tradisional ini juga disebut sebagai deinisi berupa genus dan diferentia (genus dan pembeda). Atkins dan Rundell memberikan contoh kata convertible berikut ini. car with a folding or detachable roof Dalam deinisi tersebut, car adalah genus, sedangkan pembedanya covertible dengan mobil lainnya adalah ‘with a folding or detachable roof’ (Atkins, 2008: 414). Selain itu, Atkins dan Rundell (2008: 417—418) juga menjelaskan pendeinisian dengan model prototipe. Pendeinisian dengan prototipe memperlihatkan deinisi yang berisi konsep prototipe sebuah kata. Atkins dan Rundell memberikan contoh deinisi kata bus berikut ini. a large motor vehicle motor vehicle carrying passengers by road, typically one serving the public on ixed route and for a fare (ODE-2 2003) Bagian pertama deinisi di atas merupakan informasi yang penting tentang kata bus, sedangkan bagian berikutnya merupakan penjelasan yang berisi ciri bus pada umumnya. Pada kenyataannya terkadang terdapat bus yang tidak diperuntukkan bagi masyarakat 212 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 212 8/2/16 11:20 AM umum dan tidak dipungut biaya, misalnya bus sekolah, bus yang mengangkut penumpang dari bandara, dari terminal di bandara ke pesawat, dan bus yang mengangkut pegawai. Deinisi kata bus di atas tidak mengandung informasi mengenai hal itu semua, tetapi deinisi tersebut mengandung informasi yang cukup yang memungkinkan pengguna kamus untuk memahami variasi-variasi lainnya dari prototipe, khususnya prototipe kata bus. Model pendeinisian yang lain yang dijelaskan oleh Atkins dan Rundell adalah deinisi dengan model sinonim. Pendeinisian dengan model sinonim dapat efektif ketika sinonim yang diberikan di dalam deinisi disertai informasi yang memberikan penjelasan tentang batasan-batasan tertentu dalam persamaan kata tersebut. Akan tetapi, di lain pihak, pendeinisian dapat menjadi kurang efektif karena tidak ada dua kata yang bermakna sama persis. Pendeinisian dengan model sinonim dapat digunakan jika deiniendum dan sinonim yang digunakan sama persis secara semantis, yang dalam beberapa hal dapat dibedakan antara lain dari sudut registernya, distribusi regional, atau sikap penutur (Atkins dan Rundell, 2008: 420—421). III. MeTode Penjaringan data kosakata budaya dalam penelitian ini dilakukan dengan menggunakan korpus BIPA yang disusun oleh Program BIPA LBI UI (Suhardijanto dan Diautami 2015). Korpus BIPA yang hingga kini telah mencapai 1,5 juta kata disusun dari teks materi ajar, tulisan mahasiswa, transkripsi tuturan guru dan mahasiswa, dan dokumen lain terkait pembelajaran BIPA, tidak hanya yang ada di lingkungan BIPA UI, tetapi juga di tempat lainnya. Dalam korpus 1, 5 juta kata yang telah disusun ditemukan beberapa kosakata budaya, baik yang asli Indonesia maupun yang serapan, antara lain yang berkaitan dengan makanan (bajigur), kata sapaan (abang), kesenian daerah (angklung), salam/ ungkapan (assalamualaikum), adat (sekaten) dan busana (jilbab). Dalam pemilihan dan penentuan kosakata, juga digunakan metode korpus seperti n-gram, kolokasi dan konkordansi untuk menyortir dan mengecek pemakaian kosakata tersebut di dalam teks (lebih lanjut lihat Linquist 2010 dan Chen 2011). Penggunaan n-gram dengan format bigram atau trigram dilakukan untuk menemukan kata yang biasanya berkombinasi dengan kosakata budaya. Selanjutnya, untuk mengetahui dalam konteks apa kosakata budaya digunakan dalam penelitian ini dimanfaatkan metode kolokasi. Teknik akan memberikan informasi mengenai konteks pemakaian kosakata budaya yang bersangkutan. Sementara itu, untuk mengecek pemakaian kosakata budaya di dalam korpus, digunakan metode konkordansi atau KWIC (key word in context). Ketiga metode tersebut diperlukan untuk membantu merumuskan deinisi yang tepat dan sesuai dengan tujuan kamus BIPA. Selain itu, pengecekan pemakaian kosakata melalui teknik konkordansi atau juga dapat bermanfaat untuk menemukan contoh pemakaian yang dapat digunakan dalam pengerjaaan mikrostruktur kamus. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 213 213 8/2/16 11:20 AM 3.1 Pengolahan data Dalam penentuan kosakata budaya, digunakan beberapa teknik analisis korpus (Linquist 2010, Chen 2011, dan McEnery ). Untuk menjaring kosakata tersebut, digunakan korpus BIPA yang bersumber dari materi ajar dan hasil pekerjaan siswa, baik lisan maupun tulis, serta tuturan guru. Dalam korpus yang berjumlah 1,5 juta kata itu ditemukan beberapa kosakata budaya, baik yang asli Indonesia maupun yang serapan, antara lain yang berkaitan dengan makanan (bajigur), kata sapaan (abang), kesenian daerah (angklung), salam/ungkapan (assalamualaikum), adat (sekaten) dan busana (jilbab). Setelah kosakata budaya terpilih, disusunlah kriteria untuk menentukan mana kosakata yang pantas dimasukkan sebagai entri di dalam kamus BIPA dan mana yang tidak. Kriteria tersebut 1. Sesuai dengan tujuan kamus. Kamus yang akan disusun adalah kamus untuk tujuan pedagogis. Oleh karena itu, kosakata budaya yang dimasukkan sebagai entri di dalam kamus BIPA adalah kosakata yang bermanfaat dan dapat digunakan oleh pemelajar BIPA, baik dalam proses belajar-mengajar dan juga untuk bersosialisasi dengan masyarakat Indonesia. 2. Bukan merupakan kosakata yang belum diserap dalam bahasa Indonesia. Sebagai acuan, digunakan KBBI. Kosakata budaya yang akan dimasukkan sebagai entri di dalam kamus merupakan kosakata yang sudah diserap ke dalam bahasa Indonesia, baik kosakata asing maupun kosakata yang berasal dari bahasa daerah. 3. Berdasarkan frekuensi dan distribusi pemakaian kosakata di dalam korpus. Adapun terdapat beberapa kriteria dalam pemakaian kosakata di dalam korpus, yaitu frekuensi kosakata lebih dari 3, distribusi pemakaian kosakata minimal digunakan oleh 3 orang siswa baik tulis maupun lisan, distribusi pemakaian kosakata minimal digunakan lebih dari 3 dalam materi ajar. Berikut ini adalah beberapa kosakata budaya yang ditemukan di dalam korpus beserta frekuensi penggunaannya. 1. Makanan: gudeg (4), bajigur (7), rendang (27) 2. Kata Sapaan: abang (6), mas (129), mbak (167) 3. Kesenian Daerah: wayang (20), angklung (25), gamelan (80) 4. Salam/ Ungkapan: Insya Allah (4), Assalamualaikum (20), Alhamdulillah (33) 5. Adat: Ngaben (3), Sekaten (9), gunungan (8) 6. Busana: sarung (7), kebaya (8), jilbab (135) 3.2 Penyusunan Kamus Dalam penyusunan kamus, terdapat beberapa tahap yang harus ditempuh, yaitu (1) penentuan pengguna kamus; (2) penentuan jenis kamus (apakah kamus yang akan 214 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 214 8/2/16 11:20 AM disusun termasuk dalam kamus monolingual atau bilingual, kamus umum atau kamus khusus, kamus besar atau kamus terbatas, dan lain-lain), kamus untuk umum atau untuk pelajar, untuk orang dewasa atau anak-anak; (3) penentuan sumber kosakata yang kemudian akan disusun menjadi korpus; (4) penentuan mikrostruktur kamus, termasuk di dalamnya mencakup penetapan kosakata yang akan dimasukkan sebagai lema di dalam kamus dan penetapan pendeinisian kamus; serta (5) penetapan makrostruktur kamus. Penelitian ini berfokus pada kamus yang sedang disusun, yaitu kamus ekabahasa yang ditujukan untuk pemelajar BIPA sebagai pengguna kamus. Dalam kaitan penyusunan kamus, kamus pemelajar BIPA ini menggunakan korpus BIPA sebagai sumber kosakata. Setelah dilakukan pengolahan terhadap kosakata-kosakata dalam korpus tersebut dan ditetapkan beberapa kosakata yang masuk, langkah berikutnya adalah penyajian kosakata tersebut di dalam kamus. Salah satu langkah penting dalam penyajian kamus tersebut adalah penentuan cara pendeinisian yang tepat untuk sebuah lema, khususnya lema berupa kosakata budaya. Berkaitan dengan pengolahan dan penyajian kamus BIPA ditemukan beberapa permasalahan. Beberapa permasalahan yang muncul dalam pengolahan dan penyajian kosakata tersebut juga akan dijelaskan dalam makalah ini. IV. ANAlISIS PeNgolAHAN dAN PeNyAJIAN KoSAKATA dAlAM KAMuS PeMelAJAr BIPA Pada bagian ini akan dijelaskan analisis pengolahan, penentuan, dan penyajian kosakata budaya dalam kamus pemelajar BIPA yang sedang disusun. Karena ada beberapa topik yang menjadi fokus dalam pembahasan ini, bagian ini dibagi menjadi tiga subbagian yang akan membicarakan pengolahan, penyajian, serta permasalahan yang dijumpai dalam pengerjaan kosakata dalam kegiatan penyusunan kamus BIPA. 4.1 Pengolahan Kosakata dalam Kamus Pemelajar BIPA Sebagaimana telah disebutkan pada bagian sebelumnya, penyusunan kamus BIPA bertujuan pedagogis karena ditujukan untuk membantu para pemelajar bahasa Indonesia. Meskipun demikian, pada tahap awal, penyusunan difokuskan pada pembuatan kamus ekabahasa BIPA yang akan menjadi dasar pengembangan kamus dwibahasa atau multilingual BIPA. Oleh karena itu, kosakata budaya yang dimasukkan sebagai kandidat entri pada tahap ini jelas merupakan kosakata yang bermanfaat dan mendukung kegiatan belajar para pemelajar bahasa Indonesia sebagai bahasa asing. Hal ini segera dapat dipenuhi karena kata yang digunakan sebagai entri dalam kamus BIPA semuanya berasal dari korpus BIPA yang sebagian besar merupakan kompilasi teks hasil karya pemelajar dan teks materi ajar BIPA. Dengan demikian, dapat diasumsikan bahwa sebagian besar data yang ada di dalam korpus BIPA merupakan kosakata yang terkait dengan topik-topik seputar pembelajaran bahasa Indonesia sebagai bahasa asing. Selain Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 215 215 8/2/16 11:20 AM kriteria paedagogis, kosakata yang bermanfaat dalam bersosialisasi dengan masyarakat Indonesia pun dipertimbangkan sebagai kandidat entri pada kamus pemelajar BIPA. Untuk menyortir data, digunakan ambang frekuensi 3 sebagai batas ambang (threshold) sehingga kosakata yang hanya muncul sekali atau dua kali dalam korpus BIPA. Dengan kriteria ini diperoleh, misalnya, beberapa kosakata seperti angklung (25), sarung (7), dan gado-gado (11). Sementara itu, kata seperti angkringan (2), langgar (1), dan sesajen (1) tidak akan masuk menjadi kandidat entri. Kata angkringan atau langgar, selain berfrekuensi rendah, sebenarnya juga penggunaannya sangat terbatas. Jadi, kata ini menjadi kosakata yang sangat spesiik karena angkringan merujuk pada jenis penjaja makanan yang hanya ada di Yogyakarta, sementara langgar juga merupakan jenis tempat ibadah kecil bagi muslim di pedesaan, khususnya di Jawa. Kemudian, kriteria kedua adalah kandidat entri merupakan kosakata bahasa Indonesia yang sudah diserap dan dicatat di dalam KBBI edisi keempat (2008). Dengan demikian, kosakata yang belum diserap jelas bukan merupakan kandidat entri dalam kamus pemelajar BIPA yang sedang disusun. Sebagian besar kosakata budaya merupakan kosakata yang sangat erat kaitannya dengan kebudayaan setempat. Oleh karena itu, sebagian besar kosakata budaya merupakan kosakata asing maupun kosakata yang berasal dari bahasa daerah. Dalam hal ini, digunakan KBBI sebagai dasar penentuan. Dengan demikian, kata seperti anjeun (2) jelas tidak akan masuk menjadi kandidat entri. Selain frekuensi sebagai dasar penentuan kosakata layak atau tidak menjadi kandidat entri, dalam penelitian ini juga digunakan kriteria distribusi pemakaian kosakata di dalam korpus. Jadi, distribusi pemakaian kosakata minimal digunakan dalam dua atau lebih teks. Dengan demikian, jika ditemukan kosakata yang berfrekuensi tiga, namun hanya muncul pada satu naskah teks, kosakata tersebut tidak dipilih sebagai kandidat entri karena persebarannya yang sangat spesiik dan terbatas. 4.2 Penyajian Kosakata dalam Kamus Pemelajar BIPA Pada bagian kerangka teori telah dijelaskan beberapa jenis kamus. Berdasarkan jumlah bahasa sasarannya, kamus BIPA termasuk dalam kamus ekabahasa. Berdasarkan jangkauan isinya, kamus ini termasuk dalam kamus terbatas, dalam hal ini terbatas pada kosakata dalam bahasa Indonesia yang digunakan oleh pemelajar BIPA. Sementara itu, berdasarkan penggunanya, kamus BIPA digunakan oleh orang yang mempelajari bahasa Indonesia sebagai bahasa asing. Seperti yang sudah dijelaskan di atas, kamus BIPA ini disusun berdasarkan korpus BIPA. Setelah dilakukan penyeleksian terhadap kosakata di dalam korpus tersebut, terpilih beberapa kosakata yang masuk sebagai entri kamus. Kosakata tersebut dapat berupa kosakata dasar dan kosakata budaya. Salah satu kegiatan yang dilakukan berikutnya adalah memberikan definisi terhadap kosakata yang masuk sebagai lema. Dalam memberikan deinisi terhadap kosakata tersebut terdapat beberapa hal 216 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 216 8/2/16 11:20 AM yang harus diperhatikan, antara lain (1) deinisi seperti apa yang dibutuhkan untuk memahami kosakata budaya tersebut secara komprehensif; (2) informasi lain apa lagi yang dibutuhkan untuk memahami kosakata budaya tersebut (misalnya informasi mengenai etimologi dan perkembangan makna sebuah kosakata); (3) bagaimana pembentukan kosakata budaya tersebut (berkaitan dengan pembentukan kata berupa aiksasi, reduplikasi, komposisi, abreviasi, dan lain-lain). Dalam penyajian kosakata tersebut di dalam kamus BIPA ini, tujuan penyusunan kamus dan pengguna kamus menjadi dasar penentuan bagaimana sebuah kosakata dideinisikan dan diberikan penjelasan lain. Sasaran pengguna kamus ini adalah pemelajar BIPA, yaitu orang yang mempelajari bahasa Indonesia dan menggunakan bahasa Indonesia sebagai bahasa asing. Kamus ini diharapkan dapat membantu pengguna kamus, yaitu pemelajar BIPA, dalam menelusuri kosakata bahasa Indonesia, khususnya bahasa Indonesia yang digunakan oleh pemelajar BIPA dalam kegiatan mempelajari bahasa Indonesia serta dalam kehidupan sehari-hari. Di dalam kamus BIPA, kosakata budaya membutuhkan penjelasan atau deinisi berdasarkan konteks budayanya, yang terkadang membutuhkan penjelasan berupa deinisi yang lebih komprehensif. Berdasarkan penjelasan di atas, pengguna kamus BIPA dapat melakukan penelusuran kosakata dalam bahasa Indonesia dengan tujuan untuk mencari makna sebuah kosakata yang asing untuknya danlebih jauh lagi untuk menerapkan kosakata tersebut ke dalam lisan atau tulisan. Oleh karena itu, dibutuhkan beberapa cara dalam memberikan deinisi terhadap sebuah kosakata sehingga makna dari kosakata tersebut sesuai dengan konteks pemakaiannya. Berdasarkan korpus yang telah disusun, terdapat sejumlah kosakata yang dapat digolongkan ke dalam kosakata budaya. Kosakata budaya tersebut dapat berupa kosakata salam dan ungkapan (assalamualaikum, alhamdulillah), kata sapaan (abang, mas, mbak), makanan (bajigur, gudeg, rendang), kesenian (wayang, angklung, gamelan), adat (ngaben, sekaten, gunungan), busana (sarung, kebaya, jilbab), dan lain-lain. Agar kosakata tersebut dapat dipahami dengan tepat oleh pengguna kamus, harus ditetapkan bagaimana cara menyusun deinisi yang tepat juga. Selain sebagai pendokumentasian kosakata dalam sebuah bahasa, kamus juga berfungsi memberikan informasi mengenai makna kosakata-kosakata tersebut. Oleh karena itu, deinisi kosakata di dalam kamus merupakan hal yang penting. Berdasarkan batasan mengenai pendeinisian yang telah dijelaskan pada bagian kerangka teori, berikut akan dijelaskan deinisi beberapa kosakata budaya sebagai contoh. Berdasarkan korpus yang digunakan sebagai sumber informasi untuk melihat batasan mengenai kosakata budaya di atas, beberapa kosakata dapat dideinisikan dengan model tradisional, antara lain kata kosakata budaya berupa salam/ungkapan, kosakata kesenian, kosakata pakaian, kosakata adat, dan kosakata makanan. Berikut contoh pendeinisan yang dapat diberikan terhadap kosakata-kosakata budaya tersebut. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 217 217 8/2/16 11:20 AM 1. Deinisi kata Assalammualaikum assalamualaikum salam yang diucapkan oleh umat muslim ketika bertemu dengan umat muslim lain, ketika membuka sebuah percakapan (melalui telepon, surat, dll.), ketika berkunjung ke tempat atau rumah seseorang, ketika membuka sebuah acara atau pertemuan: Assalammualaikum wr.wb. Melalui surat ini, saya bermaksud mengundang Bapak/Ibu dalam acara sebagai berikut. Pada deinisi kata assalammualaikum di atas, salam merupakan genus, sedangkan informasi lain, yaitu ‘diucapkan oleh umat muslim ketika bertemu dengan umat muslim lain, ketika membuka sebuah percakapan (melalui telepon, surat, dll.), ketika berkunjung ke tempat atau rumah seseorang, ketika membuka sebuah acara atau pertemuan’ merupakan pembeda kataa Assalammualaikum dari kosakata salam lainnya. Deinisi kata assalamualaikum di atas juga dilengkapi dengan contoh pemakaian. Berdasarkan korpus yang digunakan, salah satu pemakaian kata tersebut, muncul dalam kalimat salam pembuka sebuah surat. 2. Deinisi kata angklung angklung alat musik tradisional Indonesia yang berasal dari Jawa Barat, yang terbuat dari bambu yang dimainkan dengan cara digoyangkan. Sumber: http://update-proile.blogspot.co.id/2011/11/sejarah-alat-musik-angklung.html?m=1 Kata angklung juga dapat dideinisikan dengan model tradisional. Kata alat musik tradisional pada deinisi di atas merupakan genus dan ‘berasal dari Jawa Barat, yang terbuat dari bambu yang dimainkan dengan cara digoyangkan’ merupakan pembeda angklung dari alat musik tradisional lain yang juga berasal dari Jawa Barat, misalnya calung, atau alat musik tradisional dari daerah lain, misalnya gamelan, yang dimainkan dengan cara dipukul. Selain itu, jika pada deinisi kata assalammualaikum diberikan contoh pemakaian sebagai pelengkap deinisi, pada deinisi kata angklung di atas diberikan dua gambar, yaitu gambar alat musik angklung dan gambar orang yang sedang memainkan angklung. Kamus ini merupakan kamus pemelajar BIPA. Informasi berupa gambar di atas menjadi informasi yang sangat berguna untuk memberikan gambaran yang lebih lengkap kepada pemelajar BIPA mengenai alat musik angklung. 218 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 218 8/2/16 11:20 AM 3. Deinisi kata sekaten sekaten upacara tradisional yang dilakukan masyarakat Daerah Istimewa Yogyakarta yang diselenggarakan dari tanggal 5 sampai 11 bulau Rabi’ul Awal, atau dalam kalender Jawa disebut bulan Maulud, dalam rangka memperingati hari kelahiran Nabi Muhammad saw. Tahapan Upacara Sekaten: (1) Pada tanggal 5 Rabi’ul Awal, pukul 16.00—23.00, dibunyikan gamelan sebagai tanda dimulainya upacara Sekaten. Setelah itu, pada pukul 23.00 gamelan dipindahkan ke pagongan yang ada halaman Masjid Agung. (2) Setelah itu, di pagongan, gamelan dibunyikan pada siang dan malam hari, kecuali pada waktu salat dan pada hari Jumat. (3) Tahap selanjutnya adalah pembacaan riwayat kelahiran Nabi Muhammad saw di serambi Masjid Agung pada tanggal 11 Rabi’ul Awal, pada pukul 20.00—23.00. (4) Tahap terakhir adalah pengembalian gamelan dari Masjid Agung ke keraton, pada tanggal 11 Rabi’ul Awal pukul 23.00. (5) Pada tanggal 12 Rabi’ul Awal dilakukan penutupan upacara Sekaten dengan menyelenggarakan uapacara Garebeg Maulud. Kata sekaten di atas juga dideinisikan dengan cara tradisional. Genus kata ini adalah upacara tradisional. Untuk membedakan dengan upacara tradisional yang lain, diberikan pembeda, yaitu ‘dilakukan masyarakat Daerah Istimewa Yogyakarta yang diselenggarakan dari tanggal 5 sampai 11 bulau Rabi’ul Awal, atau dalam kalender Jawa disebut bulan Maulud, dalam rangka memperingati hari kelahiran Nabi Muhammad saw.’. Selain itu, untuk memberikan gambaran yang lebih jelas lagi mengenai kata sekaten, deinisi dapat ditambahkan dengan informasi mengenai tahap-tahap upacara. Informasi tambahan ini bermanfaat untuk memberikan penjelasan yang lebih komprehensif serta untuk menambahkan informasi mengenai budaya Indonesia, khususnya mengenai upacara tradisional. 4. Deinisi kata rendang rendang makanan tradisional Indonesia yang berasal dari Sumatera Barat, yang terbuat dari daging, santan, dan dibumbui dengan cabai, bawang putih, bawang merah, ketumbar, kemiri, kunyit, jahe, langkuas, daun kunyit, daun jeruk, daun salam, merica, gula, dan garam. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 219 219 8/2/16 11:20 AM resep rendang Bahan-bahan: - 1 kg daging sapi - 1 liter santan dari 2 buah kelapa parut - 15 siung bawang putih - 15 siung bawang merah - 10 buah cabai merah, buang bijinya - 5 buah kemiri sangrai - 1 cm jahe - 1 cm kunyit - 1 ruas langkuas - 1 sendok teh merica - 1 sendok teh ketumbar - 3 lembar daun jeruk - 3 lembar daun salam - 1 lembar daun kunyit - 2 sendok teh gula - 2 sendok teh garam Cara membuat: Pertama-tama, iris daging. Setelah itu, haluskan bumbu. Tumis bumbu sampai berbau harum kemudian masukkan daging. Aduk hingga semua bumbu merata dan daging berubah warna. Setelah itu masukkan santan encer. Kemudian, masukkan garam dan gula, lalu aduk-aduk sampai santan menyusut setengahnya. Setelah itu, masukkan santan kental, lalu terus aduk sampai daging menjadi empuk dan berwarna kecoklatan. Sumber: https://cookpad.com/id/cari/rendang Kosakata rendang juga dideinisikan dengan pendeinisian tradisional, yaitu dengan kata makanan tradisional yang merupakan genus dan ‘berasal dari Sumatera Barat, yang terbuat dari daging, santan, dan dibumbui dengan cabai, bawang putih, bawang merah, ketumbar, kemiri, kunyit, jahe, langkuas, daun kunyit, daun jeruk, daun salam, merica, gula, dan garam’ yang merupakan pembeda kata rendang dari makanan tradisional Indonesia lainnya, khsususnya yang berasal dari Sumatera Barat, misalnya sate padang, atau makanan yang terbuat dari daging, misalnya semur. Beberapa makanan tradisional dari Sumatera Barat terbuat dari bahan daging sapi, misalnya dendeng batokok. Untuk lebih memberikan pembedaan antara rendang dengan makanan tradisional lain, khususnya yang berasal dari Sumatera Barat, deinisi di atas dilengkapi dengan resep dan gambar. Hal ini tentu saja untuk memberikan pemahaman yang lebih komprehensif kepada pemelajarBIPA, di samping, secara tidak langsung memperkenalkan budaya Indonesia, khususnya makanan tradisional. 220 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 220 8/2/16 11:20 AM Selain pendeinisian secara tradisional, beberapa contoh data berupa kosakata budaya yang diambil dalam penelitian ini dapat dideinisikan dengan sinonimnya. Dalam data yang diambil dari korpus BIPA terdapat kosakata berupa kata sapaan, yaitu kata abang, mas, dan mbak dan kosakata pakaian, yaitu kata kebaya, sarung, dan jilbab. Kosakata mbak dan jilbab dapat dideinisikan dengan deinisi sinonim. Berikut contoh pendeinisian kata mbak dan jilbab. 5. Deinisi kata mbak mbak (1) kakak perempuan; (2) kata sapaan untuk wanita yang usianya lebih tua di daerah Jawa; (3) kata sapaan untuk wanita yang lebih muda, biasanya dalam situasi belum mengenal wanita itu atau dalam situasi yang berkaitan dengan pelayanan jasa di toko, restoran, dll. Deinisi (1) pada kata mbak merupakan deinisi sinonim. Kata mbak bersinonim dengan kata kakak perempuan. Semantara itu, deinisi (2) dan (3) merupakan deinisi tradisional. Genus pada deinisi (2) dan (3) sama, yaitu kata sapaan, tetapi pembeda deinisi (2) dan (3) berbeda. Deinisi (2) memperlihatkan pendeinisian dari sudut asal daerah kata mbak, yaitu ‘wanita yang usianya lebih tua di daerah Jawa’, sedangkan deinisi (3) berkaitan dengan situasi pemakaiannya, yaitu ‘wanita yang lebih muda, biasanya dalam situasi belum mengenal wanita itu atau dalam situasi yang berkaitan dengan pelayanan jasa di toko, restoran, dll’. 6. Deinisi kata jilbab jilbab (1) kerudung; (2) penutup kepala yang berbentuk lebar yang digunakan oleh wanita muslim untuk menutupi kepala, leher, sampai ke dada. Seperti deinisi kata mbak, deinisi kata jilbab juga dapat dilakukan dengan pendeinisian sinonim (deinisi 1) dan cara tradisional (deinisi 2). Kata jilbab bersinonim dengan kata kerudung. Untuk melengkapi informasi perbedaan antara kerudung dan jilbab, diberikan deinisi secara tradisional, yaitu dengan dengan memberikan penjelasan berupa genus penutup kepala dan pembedanya ‘berbentuk lebar yang digunakan oleh wanita muslim untuk menutupi kepala, leher, sampai ke dada’. Dengan demikian, dapat dilihat bahwa pendeinisian kosakata budaya dapat dilakukan hanya dengan satu cara, misalnya deinisi tradisional saja, seperti deinisi pada beberapa kata sebelumnya, atau dengan dua cara pendeinisi, yaitu sinonim dan tradisional, seperti pada deinisi kata mbak dan jlbab. Di dalam data yang diambil dari korpus terdapat kosakata budaya pakaian, yaitu kata sarung, jilbab, dan kebaya. Kata jilbab, seperti dijelaskan sebelumnya, dapat dideinisikan dengan model sinonim (dan termasuk di dalamnya deinisi tradisional). Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 221 221 8/2/16 11:20 AM Di pihak lain, kata kebaya dapat dideinisikan dengan model prototipe. Berikut contoh pendeinisian kata kebaya. 7. Deinisi kata kebaya kebaya pakaian tradisional untuk wanita yang digunakan di bagian atas tubuh, berlengan panjang, digunakan dengan kain panjang, dan biasanya digunakan dalam kegiatan tradisi budaya atau dalam menghadiri acara-acara formal. Deinis kata kebaya di atas merupakan protototipe dari kebaya pada umumnya. Deinisi tersebut mengandung pendeinisian tradisional, yang terdiri atas genus pakaian tradisional dan pembeda ‘untuk wanita yang digunakan di bagian atas tubuh, berlengan panjang, digunakan dengan kain panjang, dan biasanya digunakan dalam kegiatan tradisi budaya atau dalam menghadiri acara-acara formal’. Seperti yang sudah dijelaskan sebelumnya, dalam deinisi prototipe, sebuah kata dideinisikan dengan informasi umum kata tersebut. Dalam deinisi di atas, kata kebaya dideinisikan dengan ‘pakaian tradisional untuk wanita yang digunakan di bagian atas tubuh, berlengan panjang, digunakan dengan kain panjang’. Dalam perkembangannya, dalam kehidupan sehari, kata kebaya juga dapat mengacu pada pakaian tradisional untuk wanita yang digunakan pada bagian atas tubuh, berlengan panjang atau pendek, dan dapat digunakan dengan kain panjang atau rok, bahkan dengan celana panjang. Selain itu, dalam deinisi di atas, kata kebaya mengacu pada ‘pakaian yang biasanya digunakan dalam kegiatan tradisi budaya atau dalam menghadiri acara-acara formal’. Dalam perkembangannya, saat ini kebaya dapat digunakan dalam berbagai kesempatam, baik formal maupun nonformal. Deinisi kata kebaya di atas tidak mengandung informasi mengenai hal itu yang berkaitan dengan perkembangan pemakaian kata tersbut, tetapi deinisi tersebut mengandung informasi yang cukup yang memungkinkan pengguna kamus untuk memahami variasi-variasi lainnya dari prototipe, khususnya prototipe kata kebaya. Berdasarkan contoh pendeinisian pada beberapa kosakata budaya yang diambil dari korpus BIPA di atas dapat dilihat bahwa beberapa kelompok kosakata budaya, yaitu kosakata salam/ungkapan, kesenian (alat musik), adat (upacara adat), dan makanan, dapat dideinisikan dengan pendeinisian tradisional, yaitu berdasarkan genus dan pembedanya. Selain itu, untuk memberikan pemahaman yang lebih komprehensif kepada pemelajar BIPA, beberapa deinisi dilengkapi dengan contoh pemakaian, dengan gambar, dengan urutan prosesi, serta dengan resep masakan. Selain untuk memberikan pemahaman, informasi berupa contoh pemakaian, gambar, urutan prosesi, dan resep tersebut, secara tidak langsung juga bertujuan memperkenalkan budaya Indonesia. Beberapa kelompok kosakata lain, yaitu kosakata kata sapaan, khususnya pada kata mbak, dan kosakata pakaian, khususnya pada kata jilbab, dapat dideinisikan dengan memberikan sinonimnya. Selain informasi berupa sinonim atau persamaan kata, deinisi pada kosakata tersebut dapat dilengkapi dengan deinisi tradisional. 222 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 222 8/2/16 11:20 AM Beberapa kosakata budaya juga dapat dideinisikan dengan melihat prototipenya. Pada contoh di atas, dapat dilihat deinisi kosakata kebaya berdasarkan prototipenya. Tidak tertutup kemungkinan terdapat kosakata budaya lain yang juga dapat dideinisikan berdasarkan prototipenya. 4.3 Permasalahan yang Muncul dalam Pengolahan dan Penyajian Kosakata Budaya dalam Kamus BIPA Berdasarkan pembahasan di atas, dalam proses menyusun kamus BIPA, mulai dari menyusun korpus sampai pemberian deinisi, muncul beberapa permasalahan, berkaitan dengan pengolahan dan penyajian kosakata budaya. Dalam pengolahan kosakata permasalahan muncul dalam menentukan batasan mana kosakata budaya yang harus masuk dan mana yang tidak. Persoalan itu tidak hanya bersifat teknis, tetapi juga dari segi teoretis. Karena semua data kosakata budaya dalam penyusunan kamus BIPA ini berasal dari sumber yang sama, yakni korpus BIPA, tentu saja kosakata budaya yang tidak muncul di dalam korpus tidak disertakan sebagai entri kamus. Pada Bagian 3.1 disebutkan bahwa salah satu kriteria pemasukan entri adalah frekuensi dan distribusi. Jika kosakata ditemukan muncul lebih dari tiga kali dan digunakan dalam tiga ile berbeda, kosakata tersebut menjadi kandidat untuk dimasukkan ke dalam entri kamus. Permasalahan muncul manakala ada kosakata budaya yang sebenarnya cukup populer, namun ternyata hanya digunakan di dalam satu ile. Menurut kriteria yang digunakan pada Bagian 3.1, data kosakata tersebut tidak dapat dimasukkan sebagai entri. Permasalahan lain menyangkut kriteria semantis-kultural dalam penentuan kosakata budaya yang harus masuk ke dalam kamus. Kadang-kadang ditemukan kosakata budaya yang lazim digunakan di dalam masyarakat, namun karena belum menjadi entri dalam KBBI, kosakata tersebut tidak dapat dimasukkan sebagai entri, misalnya ngabuburit. Kriteria yang digunakan di sini memang mendasarkan penyeleksian hanya pada entri yang ada di dalam KBBI. Selain itu, muncul juga permasalahan dalam penyajian kosakata budaya di dalam kamus BIPA, khsususnya dalam pendeinisian kosakata. Penyusunan deinisi pada kamus ekabahasa seringkali menimbulkan permasalahan, terutama dalam pemilihan kata yang menjadi padanan atau deinisi kosakata. Kosakata dalam padanan atau deinisi tersebut harus dapat merepresentasikan kosakata tersebut sesuai konteks pemakaian. Akan tetapi, pemakai kamus BIPA ini berasal dari berbagai tingkat, dengan tingkat pemahaman struktur dan kosakata yang berbeda. Oleh karena itu, diperlukan cara yang tepat agar sebuah kosakata, khususnya kosakata budaya, dapat dijelaskan secara komprehensif dan dapat dipahami oleh pengguna kamus. Jika sebuah kosakata budaya kurang dapat dipahami hanya berdasarkan deinisi tradisional, sinonim, atau prototipe, seperti contoh deinisi yang telah dipaparkan di atas, dapat dicari cara lain untuk memberikan penjelasan terhadap kosakata tersebut. Misalnya dengan memberikan informasi berupa konteks pemakaian (dalam tulisan atau percakapan lisan), dengan memberikan penelasan berupa gambar atau ilustrasi, atau dengan cara-cara lainnya. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 223 223 8/2/16 11:20 AM V. PeNuTuP Makalah ini menyajikan mekanisme pengolahan dan penyajian kosakata budaya, yaitu dengan menjelaskan bagaimana kriteria pengolahan kosakata budaya berdasarkan korpus BIPA serta menjelaskan bagaimana penyajian kamus BIPA, khsususnya dengan melihat bagaimana pendeinisian kosakata budaya tersebut. Salah satu kebaruan dalam penyusunan kamus ini adalah digunakannya Korpus BIPA yang disusun dari data penggunaan bahasa secara riil baik dalam bentuk materi ajar, transkripsi tuturan siswa dan guru BIPA, tulisan siswa, serta dokumen yang berhubungan dengan BIPA. Pada makalah ini telah dijelaskan batasan mengenai apa yang dimaksud dengan kosakata budaya serta kriteria yang digunakan untuk menentukan apakah kosakata budaya tertentu dimasukkan sebagai entri kamus atau tidak. Selain itu, juga telah disebutkan juga beberapa permasalahan yang terkait dengan pengolahan kosakata, khususnya dalam hal penentuan entri, dan penyajian kosakata dalam bentuk entri kamus, khususnya strategi penyajian deinisnya. Dalam proses pengolahan dan penyajian tersebut ditemukan beberapa permasalahan. Penyusunan kamus BIPA ini masih terus berjalan sehingga penyesuaian dapat saja dilakukan dalam perjalanan waktu untuk tujuan penyempurnaan. Saat ini, penyusunan lebih diprioritaskan untuk pembuatan kamus ekabahasa BIPA sebagai dasar. Untuk pengembangan selanjutnya, akan diutamakan penyusunan kamus dwibahasa BIPA untuk bahasa Inggris-bahasa Indonesia dan sebaliknya. Pada masa depan, bukan tidak mungkin akan disusun pula kamus dwibahasa BIPA untuk pemelajar dari Jepang, Korea, dan negara ASEAN karena pada saat ini merekalah yang mendominasi peserta ajar BIPA di beberapa institusi penyelenggaraan BIPA. daftar Pustaka Amalia, D. (2014). Formulasi Pendeinisan dan Model Pengentrian Verba dalam Kamus Pemelajar Bahasa Indonesia. Disertasi pada Program Doktor Ilmu Linguistik Universitas Indonesia. Atkins, B.T. and Michael Rundell. (2008). The Oxford Guide to Practical Lexicography. New York: Oxford Unversity Press. Bogaards, Paul. (2003). “Uses and Users of Dictionaries” dalam A Practical Guide to Lexicography. Piet van Sterkenburg (Ed.). Amsterdam/Philadelphia: John Benjamins Publishing Company. Chaer, Abdul. (2007). Leksikologi dan Leksikograi Indonesia. Jakarta: Rhineka Cipta. Cheng, W. (2011). Exploring Corpus Linguistics: Language in Action (Routledge Introductions to Applied Linguistics. New York: Routledge. 224 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 224 8/2/16 11:20 AM Cruse, D. A. (1992). Meaning in Language, an Introduction to Semantics and Pragmatics. Oxford: Oxford University Press. Duranti, Alessandro. (2009). Linguistics Anthropology. Cambridge: Cambridge University Press. Jourdan, Christine dan Tuite, Kevin. (2006). Language, Culure, and Society. Cambridge: Cambridge University Press. Koentjaraningrat. (1979). Pengantar Ilmu Antropologi. Jakarta: Aksara Baru. Kridalaksana, H. (2003). “Sambutan Ilmiah Kepala Pusat Leksikologi dan Leksikograi Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia.” Dalam Lilie Suratminto dan Munawar Holil (ed.). Rintisan Kajian Leksikologi dan Leksikografi. Depok: Fakultas Ilmu Pengetahuan Budaya, Universitas Indonesia. Lindemann, D. (2013). Bilingual Lexicography and Corpus Methods. The Example of German-Basque as Language Pair. Procedia-Social and Behavioral Sciences, 95, 249-257. Lindquist, H. (2009). Corpus Linguistics and the Description of English. Edinburg: Edinburg University Press. McEnery, T., dan Hardie, H. (2011). Corpus Linguistics: Method, Theory and Practice. Cambridge: Cambridge University Press. Purwaningsih. Ernawati. (2014, Januari 13). Upacara Tradisional Sekaten. 5 Juli 2016. http://bpadjogja.info/article/site/view/id/594/t/upacara-tradisional-sekaten Suhardijanto, T. dan Diautami, A. (2015). Frekuensi dan Perbandingan Kosakata Dasar: Informasi dari Korpus Elektronik BIPA Universitas Indonesia. Makalah disajikan dalam Konferensi Internasional Pengajaran BIPA, Hotel Harris Sunroad, Denpasar, Bali, 30 Oktober-3 November 2015. Zgusta, L. (1971). Manual of Lexicography. The Hague, Paris: Mouton. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 225 225 8/2/16 11:20 AM 226 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 226 8/2/16 11:20 AM Aspek-Aspek dalam Penanganan Kata-Kata Budaya dalam Kamus Besar Bahasa Indonesia: Nama-Nama Makanan Indonesia Deina dan Renny Soelistiyowati Dosen Bahasa Indonesia IPB [email protected]; [email protected]; [email protected] Abstrak Kamus Besar Bahasa Indonesia (KBBI) merupakan rujukan bagi masyarakat Indonesia untuk mengetahui makna sebuah kata. Bahkan, KBBI juga menjadi rujukan bagi warga negara asing yang mempelajari bahasa Indonesia (BIPA). Saat ini, KBBI pun akan dikembangkan dengan memuat lema-lema atau kata-kata yang ada di Indonesia, termasuk kata-kata dalam bahasa daerah. Salah satu kelompok kata atau lema yang bisa dimasukan itu adalah lemalema atau kata-kata kebudayaan, terutama kebudayaan daerah di Indonesia. Begitu banyak aspek budaya yang dapat dimuat dalam KBBI, namun dalam penulisan ini, aspek budaya yang dibahas hanyalah makanan atau kuliner Indonesia. Untuk itu, tujuan penulisan ini adalah 1) mengkaji penjelasan istilah makanan Indonesia yang dimasukan ke dalam KBBI, 2) mengidentiikasi nama-nama makanan yang ada dalam KBBI. Metode dalam penulisan ini adalah metode deskriptif analitis. Teknik pengumpulan data dengan memilih 20 kosakata secara acak kata-kata atau kosakata makanan dalam KBBI edisi ke-3 dan ke-4. Hasil dari tujuan pertama adalah penjelasan kosakata makanan Indonesia masih kurang, yakni dari segi a) asal daerah makanan itu, b) proses pembuatan, c) alat dan bahan yang belum rinci, d) ciri khas rasa makanan itu, e) nama makanan itu di kalangan masyarakat. Hasil tujuan kedua adalah masih banyak nama-nama makanan daerah yang belum dimuat dalam KBBI. Kesimpulannya adalah 1) nama-nama makanan Indonesia yang ada dalam KBBI sebagai salah satu unsur budaya masih perlu penambahan penjelasan, dan 2) masih banyak nama-nama makanan daerah yang sudah banyak dikenal belum dimuat dalam KBBI. Kata kunci: aspek budaya, KBBI, nama-nama makanan Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 227 227 8/2/16 11:20 AM I. PeNdAHuluAN 1.1. latar Belakang Saat ini, bahasa Indonesia sedang digalakkan menjadi bagian dari bahasa-bahasa internasional. Penggalakan ini ditegaskan kembali pada Kongres Bahasa X dengan tema “Penguatan Bahasa Indonesia di Dunia Internasional”. Sehubungan dengan hal itu, tentu banyak hal-hal yang harus dipersiapkan, salah satunya adalah semakin melengkapi Kamus Besar Bahasa Indonesia, sebagai rujukan dalam pembelajaran bahasa dan budaya Indonesia. Pengajar, pegiat, dan peserta BIPA tentu membutuhkan referensi untuk mengetahui arti sebuah kata. Mereka akan berpedoman pada KBBI untuk memperkenalkan kosakata dalam bahasa Indonesia, baik kosakata formal maupun informal. Bahkan, ketika mengajarkan budaya Indonesia kepada peserta ajar BIPA tingkat pemula, pengajar BIPA akan membuka KBBI untuk mempernalkan dana kain/tenunan Indonesia, rumah adat, alat musik, seni tari, termasuk nama-nama makanan Indonesia, dan nilai-nilai/norma. Terkait dengan hal itu, pada bulan April 2016 lalu, Badan Pengembangan dan Pembinaan Bahasa, Kemdikbud, telah menyelenggarakan workshop terkait dengan Kamus Besar Bahasa Indonesia (KBBI). Di workshop itu diperoleh informasi bahwa KBBI Edisi ke-5 segera akan diterbitkan. KBBI Edisi ke-5 ini dicanangkan akan memuat dua ratus ribu lema. Dari hasil workshop itu ada rencana untuk memasukkan aspek-aspek budaya daerah ke dalam KBBI. Aspek-aspek budaya itu dapat berupa nila-nilai, kebiasaan, dan karya seni, termasuk nama makanan-makanan masyarakat di setiap daerah di Indonesia. Meskipun selama ini dalam KBBI edisi sebelumnya sudah dimasukkan aspek-aspek budaya itu, akan lebih baik lagi jika aspek-aspek budaya itu perlu ditinjau ulang, baik dari segi penambahan lema maupun dari segi penyempurnaan makna. Penelitian tentang leksikograi sudah banyak dilakukan. Salah satu artikel tentang leksikograi ditulis oleh Alberts (2011). Dalam abstraknya, diungkapkan bahwa leksikograf adalah mendokumentasikan kata-kata dalam kosakata bahasa umum. Selanjutnya, terkait dengan KBBI sebagai kamus yang memuat kosakata bahasa umum, penelitian tentang KBBI sudah banyak dilakukan, di antaranya oleh Supriyanti (2012). Pada kesimpulannya, Supriyanti (2012:153) mengatakan bahwa secara umum kamus hanya menggambarkan konsep yang berkembang di masyarakat. Permasalahan gender memengaruhi praktik leksikograi. Artinya, lema-lema yang ada dalam kamus adalah lema-lema yang ada di masyarakat. Namun, dari penelitian ini belum diketahui dengan pasti: apakah semua lema atau konsep yang ada di masyarakat sudah dimasukan dalam KBBI? Sebab, penelitian Supriyanti lebih difokuskan pada kosep gender. Bagaimana dengan konsep nomina untuk nama-nama makanan sebagai bagian dari budaya Indonesia? Apakah semua jenis makanan Indonesia sudah dirangkum dalam KBBI. Sebagai kamus besar, apakah KBBI sudah mendeskripsikan dengan lengkap kosakata jenis makanan itu? 228 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 228 8/2/16 11:20 AM 1.2. rumusan Masalah Sehubungan dengan hal itu, dalam tulisan ini ada dua rumusan masalah. Kedua rumusan masalah itu adalah sebagai berikut. 1. Bagaimana penjelasan istilah makanan Indonesia yang dimasukan ke dalam KBBI? 2. Apakah semua nama makanan ciri daerah sudah dimuat dalam KBBI? 1.3. Tujuan Berdasarkan rumusan masalah itu, tujuan penulisan ini juga ada dua. Kedua tujuan itu adalah sebagai berikut: 1) mengkaji penjelasan istilah makanan Indonesia yang dimasukkan ke dalam KBBI, dan 2) mengetahui beberapa nama makanan daerah yang ada dalam KBBI. II. KerANgKA TeorI dAN MeTode Pada bagian kedua ini akan dijelaskan dua hal. Pertama, akan dijelaskan kerangka teori yang akan digunakan dalam penelitian ini. Kedua, akan dijelaskan metode yang digunakan dalam penelitian. 2.1. Kerangka Teori Ada dua metode untuk mendeskripsikan kata-kata menurut Halliday et.al. (2004:34). Kedua metode itu adalah menulis kamus dan menulis thesaurus. Tesarus memuat kata-kata yang memiliki makna sama lalu dikelompokkan. Sebaliknya, kamus memuat kata-kata yang diatur dengan sederhana sehingga mudah ditemukan, seperti diatur berdasarkan alpabet. Fungsi kamus menurut Chaer (2007:184) adalah menghimpun semua kosakata suatu bahasa. Kosakata di sini berarti kosakata yang hidup di tengah masyarakat sebagai konsep-konsep budaya masyarakat bahasa tersebut. Kamus ini pun banyak jenisnya, berdasarkan ukurannya ada namanya kamus besar. Seperti yang telah diketahui, kamus disusun dari korpus data. Korpus data ini menurut Chaer (2007:214) adalah hal yang substansi bahasa sumber. Lebih lanjut dikatakan bahwa jika bahasa sumber tidak memiliki ragam bahasa tulisan, korpus data dapat diperoleh melalui perekaman bahasa tersebut dari penuturnya lalu hasil rekaman ditranskrip ke dalam bentuk bahasa tulisan, mulai dari ejaan fonetis sampai ejaan ortograis. Sebaliknya, jika bahasa sumber memiliki ragam bahasa tulisan, korpus data diambil dari naskah, buku, koran, majalah dan terbitan lain. Konsep korpus yang dikemukakan oleh Chaer juga sudah dikemukakan sebelumnya oleh Charteris-Black (2004:31). Korpus menurut Charteris-Black adalah sebagai berikut. Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 229 229 8/2/16 11:20 AM A corpus is any large collection of text that arise from natural language use; in linguistic context, it is in contrast to other types of text that were invented speciically for illustrating a point about language. The notion of attested language is very important in corpus linguistics and implies that data are not invented for the beneit of a model but rather that the model emerges from large and representative sample of language. Other than this, then are no constrains on corpus composition nor are there any constraints on corpus size. Dari kutipan tersebut, dapat dipahami bahwa sebuah korpus adalah setiap koleksi teks yang muncul dari penggunaan bahasa alami. Tidak ada batasan untuk komposisi korpus, begitu pun dengan ukurannya. Hal ini juga sesuai dengan pendapat Stubbs (2001) dalam Charteris-Black (2004:31). Stubbs mengungkapkan bahwa korpus dapat memberikan koleksi berbagai tipe teks. Korpus dapat dirancang untuk berbagai tipe teks yang lebih besar, termasuk tulisan, pengucapan, formal, nonformal, iksi, noniksi, bahasa yang dihasilkan anak-anak dan orang dewasa dan teks dari periode yang berbeda. Dengan demikian, KBBI sebagai salah satu jenis kamus berdasarkan ukurannya, awalnya disusun dari korpus dan tidak dibatasi dalam ukurannya. Dalam KBBI dapat dimuat bahasa tulisan dan bahasa lisan, baik formal maupun nonformal serta baik yang dihasilkan oleh orang dewasa maupun anak-anak. 2.2. Metode Metode dalam penulisan ini adalah metode deskriptif analitis. Teknik pengumpulan data dengan memilih secara acak kata-kata/kosakata makanan dalam KBBI Edisi ke-3 dan ke-4. Untuk tujuan pertama, jumlah kata atau istilah makanan Indonesia yang dipilih 20 kata secara acak, yakni 1) kalio, 2) tekwan, 3) rawon, 4) rending, 5) palai, 6) nasi, 7) lemang, 8) gudeg, 9) pempek, 10) tahu sumedang, 11) pecel, 12) asinan, 13) soto, 14) tahu, 15) lepat, 16) bikang, 17) satai, 18) rujak, 19) dodol, dan 20) ketoprak. Dari beberapa kata akan dibandingkan dengan yang ada di Wikipedia.org. Semua kata itu dianalisis penjelasannya. Selanjutnya, untuk tujuan ke-2, penulis memberikan beberapa kata atau istilah makanan yang penulis peroleh secara lisan dalam kehidupan sehari-hari lalu mengecek keberadaan kata-kata tersebut di KBB Edisi ke-4 dan membandingkannya dengan Wikipedia sebagai salah satu media rujukan untuk mencari sebuah kata. III. PeMBAHASAN Sesuai dengan tujuan, pada bagian pembahasan ini ada dua hal yang akan dibahas. Pertama adalah menguraikan penjelasan istilah nama makanan Indonesia. Kedua adalah mengidentiikasi keberadaan beberapa nama makanan di Indonesia dalam KBBI. 230 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 230 8/2/16 11:20 AM 3.1 Penjelasan istilah makanan Indonesia Seperti yang diketahui, budaya daerah adalah cikal bakal budaya nasional. Artinya, makanan daerah sebagai budaya daerah adalah representatif dari budaya Indonesia. Sesuai dengan konsep kamus yang dikemukan oleh Chaer bahwa kamus merangkum semua kosakata, dalam hal ini kosakata yang ada bahasa Indonesia. Kosakata itu adalah perwujudan dari budaya Indonesia. Sesuai dengan pendapat Chaer bahwa kamus besar lengkap dengan ejaan, makna, lafal, etimologi dan kelaziman penggunaan, dalam pembahasan ini lebih difokuskan pada penjelasan berupa makna kata yang memuat etimologinya. Hanya saja, untuk kosakata makanan, etimologi bisa diperluas kepada asal daerah makanan itu, proses pembuatan, alat dan bahan yang belum rinci, ciri khas rasa makanan itu, nama makanan itu di kalangan masyarakat. Pertama adalah penjelasan makna kata yang memuat etimologi asal daerah makanan itu. Di dalam KBBI, dapat dilihat pada bagian “Petunjuk pemakaian kamus”, yakni halaman xxxiii, nomor 4.c.2) bahasa daerah bahwa suatu lema bahasa ada diberi pengkodean sebagai bahasa daerah, seperti Mmk yang artinya bahwa kata itu berasal dari bahasa Mimika, Mk (Minangkabau), Dy (Dayak) dan sebagainya. Setelah diperhatikan, untuk lema-lema makanan, ada beberapa lema yang diberi kode asal daerahnya, namun ada juga yang tidak. Contohnya adalah kata palai (h. 1003) diberi kode Mk: “n pepes ikan kecil-kecil” dan kata kalio (h. 609) juga diberi kode Mk “n masakan dr daging dsb yg diberi santan dan bumbu, dimasakan hampir kering; rendang basah”. Artinya, kata palai dan dan kata kalio itu berasal dari Minangkabau atau digunakan dalam masyarakat Minangkabau. Contoh lainnya adalah tekwan. Penjelasan untuk kata tekwan (h. 1423) adalah “Plb n masakan berkuah dng isi pempek berbentuk kecil-kecil, irisan bengkuang bentuk korek api, jamur kuping, sedap malam, dsb ditaburi abon ebi, seledri, dan bawang goreng”. Artinya, kode Plb menunjukkan bahwa kata itu berasal dari Palembang. Namun, kata rendang (h. 1163) tidak ada penjelasan masakan Minang atau Padang. Padahal, tidak lazim lagi di kalangan masyarakat Indonesia bahwa rendang itu adalah masakan yang berasal dari suku Minangkabau. Contoh lainnya adalah rawon. Kata rawon (h. 1149) diberi penjelasan sebagai berikut: “masakan (lauk) berkuah dibuat dr irisan daging dengan bumbu utamanya keluak, ditambah rempah2 lain”. Kata ini tidak diberi penjelasan asal daerahnya. Tidak semua suku di Indonesia mengenal makanan ini, padahal makanan ini berasal dari Surabaya. Sementara itu, ada beberapa lema makanan tidak diberi kode asal daerah, tetapi dalam maknanya ada tambahan penjelasan asal daerahnya. Contohnya adalah kata gudeg pempek, dan ketoprak. Kata gudeg (h. 463) diberi pejelasan sebagai berikut: “masakan yg dibuat dr buah nangka muda diberi bumbu bersantan (masakan khas yogya)”. Contoh lainnya adalah pempek. Kata pempek (h. 1043) dijelaskan “n penganan khas daerah Palembang dr adonan tepung terigu dan ikan, dimakan dng kuah yg bercuka”. Begitu pun dengan kata ketoprak (h.691) diberi penjelasan: “n makanan (khas Jakarta) Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 231 231 8/2/16 11:20 AM terdiri atas ketupat, tahu goreng, kerupuk, dan taoge yg dibubuhi bumbu kacang yang berkecap.” Jadi, ada penjelasan asal makanan tersebut, yakni Yogyakarta, Palembang, dan Jakarta. Kedua adalah penjelasan makna kata yang memuat etimologi proses pembuatan makanan itu. Dalam memberikan makna, ada kata-kata makanan itu yang diberikan penjelasan proses pembuatannya secara singkat, namun ada juga yang tidak ada proses pembuatannya. Contoh kata yang ada penjelasan proses pembuatannya adalah kata rendang. Kata rendang diberi penjelasan sebagai berikut: “daging yang digulai dengan santan sampai kuahnya kering sama sekali, yang tinggal hanya potongan daging dengan bumbu”. Jadi, ada proses pembuatannya yakni daging digulai dengan santan sampai kering. Contoh kata yang tidak ada penjelasan proses pembuatannya adalah kata palai. Kata palai diberi penjelasan sebagai berikut: “pepes ikan kecil-kecil”. Semestinya, penjelasan untuk palai dapat ditambahkan prosesnya, yakni kelapa yang sudah diparut digiling dengan bumbu lalu dimasukan ikan kecil-kecil dan dibungkus dengan daun pisang, setelah itu dibakar dengan bara api. Ketiga adalah penjelasan makna kata yang memuat etimologi alat dan bahan pembuatan makanan itu. Pada penjelasan kata atau nama makanan, masih ada penjelasan alat dan bahannya yang belum rinci. Contohnya adalah kata lemang. Penjelasan kata lemang (KBBI Edisi ke-3, 2005:655) adalah sebagai berikut: “makan dari pulut diberi santan, dipanggang dl tabung”. Dari penjelasan itu dapat dilihat bahwa ada kata tabung. Pada KBBI Edisi ke-4 (h. 808) kata lemang diberi penjelasan : “penganan yg dibuat dr ketan diberi santan, dipanggang dl buluh bambu. Untuk kata tabung sebagai alat, kata ini tidak diberi penjelasan lagi, yakni bahan tabung itu apa? Namun, pada Edisi k-4 diberi penjelasan bambu. Namun, bambu itu banyak jenisnya dan tidak semua bambu dapat digunakan untuk tabung lemang. Jika dibuka kata talang, ada 5 nomor penjelasan, talang no 4 (h. 1383) diberi penjelasan “n, buluh tipis yg banyak mengandung air, biasanya untuk tabung memasak lemang”. Jika dibuka lema nasi, akan ada kata nasi lemang (h.953) dengan penjelasan “beras ketan dengan santan yang dimasak dl tabung bambu”. Jadi, penjelasan bambu ada pada lema talang, bukan pada lema lemang. Keempat adalah penjelasan makna kata yang memuat etimologi rasa makanan itu. Sebagai rujukan, KBBI akan digunakan untuk memahami makna kata-kata, terutama kata-kata umum karena sesuai dengan pendapat Chaer (2007: 199) KBBI termasuk kamus deskriptif atau kamus pemeri yang lengkap dengan ejaan, makna, lafal, etimologi, dan kelaziman penggunaan. Akan tetapi, dari penjelasan jenis makanan dirasa masih ada yang kurang dijelaskan, yakni rasa makanan tersebut. Sementara itu, dirasa perlu ditambahkan penjelasan rasa makanan itu sebagai salah satu ciri khas rasa makanan itu. Contohnya adalah gudeg (h. 463): “masakan yg dibuat dr buah nangka muda diberi bumbu bersantan (masakan khas yogya), bisa ditambah penjelasan rasa, yakni manis. Begitu juga dengan makanan pempek, bisa diberi penjelasan manis asam dan rendang bisa diberi penjelasan pedas. 232 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 232 8/2/16 11:20 AM Penambahan rasa ini dapat dilakukan karena pada edisi ke-4 sudah ada kata makanan yang diberi penjelasan rasanya. Pada kata tahu sumedang (h. 1377), misalnya, diberi penjelasan rasa: “tahu yg berasal dr Sumedang, apabila digoreng, terdapat rongga di dalamnya, rasanya gurih.” Kelima adalah penjelasan makna kata yang memuat etimologi nama makanan yang dikenal di kalangan masyarakat. Semestinya, di KBBI dapat ditambahkan nama makanan itu di kalangan masyarakat. Misalnya, pecel, makanan pecel (h.1034) dijelaskan sebagai berikut “n makanan yg terdiri atas sayuran rebus, spt kacang panjang, bayam, taoge yg disiram dng kuah sambal kacang dsb”. Sementara itu, makanan pecel yang berkembang di masyarakat lain adalah pecel lele. Pada makanan pecel lele, tidak ditemukan sayuran yang disebutkan dalam kamus untuk kata pecel. Contoh lainnya adalah asinan (h.93): “sayuran atau buh-buahan yg diawetkan dl cuka yg diberi garam, gula, dan rempah-rempah”. Di kalangan masyarakat juga dikenal nama asinan, bahkan dikenal nama asinan Bogor. Begitu juga dengan makanan soto, di KBBI (h. 1332) diberi penjelasan “masakan yang kuahnya dimasak tersendiri dan rangkaian isinya antara lain daging, kentang, bawang goreng yg dimasukkan kemudian, pada waktu akan dihidangkan”. Dari penjelasan tersebut tidak ada penjelasan jenis-jenis soto, seperti soto Makasar, soto Padang, soto Surabaya, dan soto Lamongan. Padahal, sudah diketahui bahwa soto Makasar dengan soto Makasar dan soto lainnya berbeda bahannya sehingga berbeda rasanya. Sebaliknya, jika dibuka kata tahu, nasi, rujak. Kata tahu (h. 1377), akan ditemukan kata tahu sumedang: “tahu yg berasal dr Sumedang, apabila digoreng, terdapat rongga di dalamnya, rasanya gurih.” Kata nasi (h.953) memiliki banyak jenisnya, di antaranya ada nasi aking, nasi anjing, nasi beriani, nasi detus, nasi gandul, nasi golong, nasi goreng, nasi gurih, nasi jaha, nasi jamblang, nasi kebuli, nasi kerak, nasi kuning, nasi kunyit, nasi lemang, nasi lengat, nasi lengko, dan nasi liwet. Selain itu, ada kata rujak (h. 1187), dari lema rujak ada jenis-jenis rujak, yakni rujak bebek, rujak buah dingin, rujak cingur, rujak colek, rujak gobet, rujak manis, rujak serut, dan rujak tumbuk. Rujak cingur, misalnya, ini adalah makanan dari Surabaya. Dari penjelasan di dalam KBBI, dapat dilihat bahwa bahan-bahan rujak cingur ini berbeda dengan bahanbahan rujak lain, begitu pun dengan prosesnya juga berbeda-beda sehingga rasanya akan berbeda pula. Begitu pun dengan nama makanan lepat (h. 818), yakni “penganan yang dibuat dr ketan dan kelapa parut serta diberi garam dibugkus dengan daun kelapa muda berbentuk silinder dan direbus. Padahal, ada lepat yang disebut lapek (bahasa Minangkabau) dengan bahannya bisa dari pisang ditambah kelapa dan ketan lalu dibungkus dengan daun pisang kemudian dikukus atau direbus. Selain itu, juga dikenal nama lepat atau lapek Bugis. Bahkan, makanan bikang, di masyarakat dikenal nama bika Ambon dan satai dikenal sate seperti sate Padang, Sate Ayam Ponorogo. Penganan dodol (h.337), juga ada dikenal dodol Garut, tetapi di KBBI tidak ada, yang ada hanya dodol. Sebaliknya, jika dibuka Wikipedia.org akan terdapat banyak penjelasan tentang soto, dodol dan sate, Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 233 233 8/2/16 11:20 AM termasuk dodol Garut dan dodol Kandangan (dari Kalimantan Selatan). Di Wikipedia.org ada soto Jepara, soto Semarang, soto Kudus, soto Betawi, soto Padang, soto Bandung, sroto Sokaraja, soto Banjar, soto Medan, dan coto Makassar. 3.2 Identiikasi keberadaan beberapa nama makanan di Indonesia dalam KBBI Sehubungan dengan rencana pengembangan KBBI Edisi ke-5, dapat dimasukan nama-nama makanan yang ada di masyarakat Indonesia. Masih ada nama-nama makanan suatu daerah atau suku yang sudah dikenal oleh masyarakat daerah atau suku lainnya bahkan nama makanan berupa penganan. Contoh penganan yang dikonsumsi masyarakat suatu daerah adalah cireng. Penganan ini adalah penganan masyarakat Sunda dan sudah dikenal di kalangan masyarakat Indonesia, terutama di Jabodetabek. Sangat banyak penganan yang dapat dimasukkan ke dalam KBBI. Beberapa contoh penganan yang dapat dimasukan ke dalam KBBI adalah nastar, lanting, kembang loyang, combro. Untuk kata kembang, kembang loyang yang ada di KBBI (h.662) “ark bubur yg terbuat dr tepung beras bercampur gula”, sedangkan yang ada di masayrakat adalah penganan yang terbuat dari tepung beras dan diberi gula lalu dicetak dengan cetakan pipih sehingga saat digoreng hasilnya lebih tipis dan garing. Jika dilihat Wikipedia.org., kata nastar, lanting, kembang loyang, combro ada. Kata nastar, misalnya, diberi penjelasan: “Nastar adalah sejenis kue kering dari adonan tepung terigu, mentega dan telur yang diisi dengan selai buah nanas. Asal katanya dari bahasa Belanda ananas.” Kata lanting diberi penjelasan: “Lanting Makanan Khas Kebumen”. Kata kembang Loyang, diberi penjelasan “…memiliki rasa yang renyah dan gurih. Kue kembang goyang juga dikenal dengan nama kue kembang loyang atau kue loyang di Sumatera.” Kata combro diberi penjelasan sebagai berikut: “combro atau kadang disebut comro atau gemet merupakan makanan khas dari Jawa Barat. Combro terbuat dari parutan singkong yang dibentuk bulat yang bagian…” IV. PeNuTuP Sesuai dengan tujuan penulisan, kesimpulannya dalam tulisan ini ada dua. Pertama, nama-nama makanan Indonesia yang ada dalam KBBI sebagai salah satu unsur budaya masih perlu penambahan penjelasan. Kedua, masih banyak nama makanan daerah yang sudah banyak dikenal belum dimuat dalam KBBI, termasuk penganan sehari-hari. 234 Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 234 8/2/16 11:20 AM daftar Pustaka Alberts, Mariëtta, 2011. “Lexicography versus Terminography.” Lexikos 11. https://doaj. org/article/1177b967d9424ad0a83d22fad14ac441(diunduh 16 Juni 2016) Chaer, Abdul. 2007. Leksikologi&Leksikograi Indonesia. Jakarta: Rineka Cipta. Charteris-Black, Jonathan. 2004. Corpus Approaches to Critical Metaphor Analysis. United Kingdom: Palgrave Macmillan Ltd. [Depdiknas] Departemen Pendidikan Nasional. 2008. Kamus Besar Bahasa Indonesia. Edisi ke-4. Jakarta: Gramedia. [Depdiknas] Departemen Pendidikan Nasional. 2005. Kamus Besar Bahasa Indonesia. Edisi ke-3. Cet. Ke-3. Jakarta: Balai Pustaka. Halliday, MAK, et.al. 2004. Lexicology and Corpus Linguistics an Introduction. New York: Continuum. Supriyanti, Nanik. 2012. Praktik leksikograi atas nomina person berorientasi gender dalam Kamus Besa Bahasa Indonesia Edisi IV. Tesis. Depok: UI. https://www.lib. ui.ac.id%2File%3File%3Ddigital%2F20313850-T31267-Praktik%2520leksikograi. pdf (diunduh 16 Juni 2016) https://id.wikipedia.org/w/index.php?title=Istimewa:Pencarian&proile=default&fulltext =Search&search Tantangan Leksikograis Bahasa-Bahasa Daerah di Indonesia PROSIDING 15-19.indd 235 235 8/2/16 11:20 AM ruMuSAN SeMINAr leKSIKogrAFI INdoNeSIA Jakarta, 26—29 Juli 2016 Dengan rahmat Tuhan Yang Maha Esa, setelah mendengarkan dan memperhatikan sambutan Kepala Badan Pengembangan dan Pembinaan Bahasa, paparan pembicara utama dan pemakalah pleno, serta tanya jawab dan diskusi yang berkembang selama sidang, Seminar merekomendasikan hal-hal, sebagai berikut. 1. Bahasa-bahasa daerah di Indonesia perlu didokumentasikan dalam bentuk kamus. 2. Badan Pengembangan dan Pembinaan Bahasa perlu menyediakan pedoman penyusunan kamus untuk memudahkan dan mempercepat proses dokumentasi. 3. Proses penyusunan kamus dapat melibatkan pihak-pihak di luar Badan Pengembangan dan Pembinaan Bahasa. 4. Badan Pengembangan dan Pembinaan Bahasa melalui Balai/Kantor Bahasa di tiap-tiap provinsi memberikan fasilitasi ke berbagai pihak dalam proses penyusunan kamus. 5. Asosiasi leksikograf di Indonesia perlu didirikan untuk mengakomodasi aspirasi masyarakat pencinta kamus. 6. Seminar leksikograi menjadi agenda tahunan yang dilaksanakan oleh Badan Pengembangan dan Pembinaan Bahasa. Jakarta, 29 Juli 2016 Tim Perumus Ketua : Anggota : 236 Dr. Wahya, M.Hum. (Universitas Padjadjaran) 1. Dr. Dora Amalia (Badan Bahasa) 2. Deny Arnos Kwary, Ph.D. (Universitas Airlangga) 3. Totok Suhardijanto, M.Hum., Ph.D. (Universitas Indonesia) 4. Nany Setyono Kurnia, Ph.D. (Unika Atma Jaya) 5. Prihantoro (Universitas Diponegoro) 6. Achmad Atho’illah, S.S. (Pondok Pesantren Nurul Huda) 7. Azhari Dasman Darnis, M.Hum. (Badan Bahasa) 8. Adi Budiwiyanto, M.Hum. (Badan Bahasa) 9. Asep Rahmat Hidayat, M.Hum. (Balai Bahasa Jawa Barat) Prosiding Seminar Leksikograi Indonesia PROSIDING 15-19.indd 236 8/2/16 11:20 AM