Binarization and segmentation process are two first important methods for optical character recog... more Binarization and segmentation process are two first important methods for optical character recognition system. For ancient document image which is written by human, binarization process remains a major challenge.In general, it is occurring because the image quality is badly degraded image and has various different noises in the non-text area.After binarization process, segmentation based on line is conducted in separate text-line from the others. We proposedanovel framework of binarization and segmentation process that enhance the performance of Niblackbinarization method and implementthe minimum of energy function to find the path of the separator line between two text-line.For experiments, we use the 22 images that come from the Sundanese ancient documents on Kropak 18 and Kropak22. The evaluation matrix show that our proposed binarization succeeded to improve F-measure 20%for Kropak 22 and 50% for Kropak 18 from original Niblack method.Then, we present the influence of various i...
Many researchers do their research on grammatical intricacy or lexical density as the main elemen... more Many researchers do their research on grammatical intricacy or lexical density as the main elements of readability of texts but it is very limited research on English children short stories. The readability test of texts is different from one text to another. The texts can be classified into spoken or written text. The classification can be based on some elements, such as the total word count or the hard words involved in the texts. This preliminary research tries to figure out the readability test based on the grammatical intricacy or lexical density of the English children short stories by applying the free application called text analyser as the text content analysis tool found in http://www.usingenglish.com/resources/text-statistics.php. The research based on the two aims of the research, they are, (1) To identify the average of hard words found in the English children short story, and (2) To identify the average of grammatical intricacy or lexical density of the English childre...
This paper describes the research and reconstruction of Kisah Putra Rama and Rawana text in the X... more This paper describes the research and reconstruction of Kisah Putra Rama and Rawana text in the XV Century. The research was conducted toward three manuscripts of Kisah Putra Rama and Rawana (PRR), which are collections of West Java State Museum “Sri Baduga” and Kabuyutan Ciburuy, Garut Regency. PRR is one of Old Sundanese literature which were written in the sixteenth century AD. The story tells the war between the son of Rama, King of Lengkawati and the son of Rawana, the king of Lengkapura which took place after Rawana passed away and Rama attained moksha. The PRR manuscripts of Kabuyutan Ciburuy are scattered in six kropaks which leaves (lempir) are mixed with leaves from other texts. The first groups, which are consisted of Kropak 17, Kropak 18, Kropak 22, the fourth leaf, and Kropak 26, is called Manuscript A. The second groups, which are consisted of Kropak 24, the third leaf of Kropak 26, and the fifth leaf of Kropak 29, is called Manuscript C. Moreover, the PRR text which h...
Naskah sebagai salah satu peninggalan masa lampau di dalamnya mengandung nilai-nilai kemanusiaan ... more Naskah sebagai salah satu peninggalan masa lampau di dalamnya mengandung nilai-nilai kemanusiaan yang merupakan hasil karya, karsa, dan cipta para nenek moyang. Naskah pun dapat dianggap sebagai salah satu sumber yang memiliki otoritas dalam memberikan berbagai informasi mengenai masa lampau. Dalam hal ini yang dimaksud dengan naskah adalah peninggalan dalam bentuk tulisan tangan. Naskah di Nusantara jumlahnya cukup melimpah bahkan untuk naskah Sunda saja, saat ini terkumpul dalam berbagai perpustakaan di dunia hampir mendekati angka 1.500 buah naskah. Jumlah tersebut kemungkinan akan semakin bertambah bila mengingat masih ada naskah-naskah yang menjadi koleksi perseorangan. Namun di balik itu, naskah pun akan berangsur-angsur berkurang karena materi naskah bukanlah bahan yang tahan lama apalagi kondisi iklim Indonesia yang tropis menyebabkan mudah terjadinya pelapukan. Oleh karena itu, naskah-naskah tersebut perlu secepatnya mendapatkan uluran tangan dari para peneliti agar kandung...
The research of script on manuscripts (Sundanese manuscript) has long been done. One reason is be... more The research of script on manuscripts (Sundanese manuscript) has long been done. One reason is because in philological work, the step of script description used for the study object is a mandatory. In almost every philological research, the section of script comparison used in the manuscript (which is used as the study object) with similar script that have been studied previously, must be found. The activity results in the revelation of the script uniqueness exists in the researched manuscript. Although these studies have contributed considerably to ease the reading of Sundanese script in other Old Sundanese manuscripts, there has not been much information on the causes of variations in Old Sundanese script. One cause is the disorganized data (the data is separated). In this paper, we will describe an application that we designed to do the indexing of Old Sundanese script. In this first stage, we use data from Old Sundanese manuscripts from Kabuyutan Ciburuy Garut. It is expected th...
adalah jurnal ilmiah yang dikelola oleh Masyarakat Pernaskahan Nusantara (Manassa), asosiasi prof... more adalah jurnal ilmiah yang dikelola oleh Masyarakat Pernaskahan Nusantara (Manassa), asosiasi profesi pertama dan satu-satunya di Indonesia yang memperhatikan pengkajian dan pelestarian naskah Nusantara. Jurnal ini dimaksudkan sebagai media pembahasan ilmiah dan penyebarluasan hasil penelitian di bidang filologi, kodikologi, dan paleografi. Terbit dua kali dalam setahun.
AbstrakSejak diluncurkannya font aksara Sunda Unicode (SundaneseLatin) pada tahun2008, penggunaan... more AbstrakSejak diluncurkannya font aksara Sunda Unicode (SundaneseLatin) pada tahun2008, penggunaan aksara Sunda mulai memasuki wilayah-wilayah baru. AksaraSunda yang sebelumnya hanya ditemukan pada buku-buku dan karya seni, kinimulai digunakan untuk penulisan nama diri, instansi, jalan, dll. Bahkan, tidak sedikitjuga digunakan sebagai media kreativitas pada benda-benda untuk kepentingankomersial seperti pada kaus, stiker, dll. Namun, keberadaan font SundaneseLatin inidi sisi lain dikhawatirkan akan menimbulkan kesalahan hasil tik aksara Sunda. Haltersebut di antaranya disebabkan adanya perbedaan teknik pengetikan aksara Sundadi komputer dan kurang pahamnya masyarakat pengguna terhadap aksara Sunda itusendiri. Aksara Sunda yang bersifat silabis (satu lambang satu suku kata) memilikiteknik pengetikan yang berbeda pada komputer yang memiliki sifat pengetikan secarafonetis. Akibatnya, pada hasil ketikan font aksara Sunda sering ditemukan kesalahanmeskipun sebenarnya pada saat peluncuran ...
Kreativitas dalam pengembangan berbagai hal berbasis komputer tidak hanya berlaku pada wilayah-wi... more Kreativitas dalam pengembangan berbagai hal berbasis komputer tidak hanya berlaku pada wilayah-wilayah kehidupan primer (utama) tetapi merambah juga ke wilayah-wilayah sekunder seperti bidang bahasa daerah. Bahasa daerah yang saat ini keberadaannya terus tersisihkan oleh para pencintanya terus dikembangkan salah satunya dengan memanfaatkan Information and Comunication Technology (ICT). Wujud nyata dari usaha tersebut di antaranya dengan dibuatnya beberapa font aksara daerah, seperti font aksara Sunda. Kemunculan font aksara Sunda ini sangat penting bagi perkembangan bahasa Sunda karena pada dasarnya aksara daerah merupakan alat rekam yang tepat bagi bahasa daerah tersebut (Baidilah dkk., 2008). Hampir di setiap wilayah di Jawa Barat aksara Sunda dapat ditemui pada nama-nama jalan, instansi, ataupun produk-produk kreatif. Kemunculan aksara Sunda di berbagai media tersebut tentunya tidak lepas dari peran font aksara Sunda Unicode (IB80-IBBF) yang mempermudah masyarakat dalam menulis ...
Binarization and segmentation process are two first important methods for optical character recog... more Binarization and segmentation process are two first important methods for optical character recognition system. For ancient document image which is written by human, binarization process remains a major challenge.In general, it is occurring because the image quality is badly degraded image and has various different noises in the non-text area.After binarization process, segmentation based on line is conducted in separate text-line from the others. We proposedanovel framework of binarization and segmentation process that enhance the performance of Niblackbinarization method and implementthe minimum of energy function to find the path of the separator line between two text-line.For experiments, we use the 22 images that come from the Sundanese ancient documents on Kropak 18 and Kropak22. The evaluation matrix show that our proposed binarization succeeded to improve F-measure 20%for Kropak 22 and 50% for Kropak 18 from original Niblack method.Then, we present the influence of various i...
Many researchers do their research on grammatical intricacy or lexical density as the main elemen... more Many researchers do their research on grammatical intricacy or lexical density as the main elements of readability of texts but it is very limited research on English children short stories. The readability test of texts is different from one text to another. The texts can be classified into spoken or written text. The classification can be based on some elements, such as the total word count or the hard words involved in the texts. This preliminary research tries to figure out the readability test based on the grammatical intricacy or lexical density of the English children short stories by applying the free application called text analyser as the text content analysis tool found in http://www.usingenglish.com/resources/text-statistics.php. The research based on the two aims of the research, they are, (1) To identify the average of hard words found in the English children short story, and (2) To identify the average of grammatical intricacy or lexical density of the English childre...
This paper describes the research and reconstruction of Kisah Putra Rama and Rawana text in the X... more This paper describes the research and reconstruction of Kisah Putra Rama and Rawana text in the XV Century. The research was conducted toward three manuscripts of Kisah Putra Rama and Rawana (PRR), which are collections of West Java State Museum “Sri Baduga” and Kabuyutan Ciburuy, Garut Regency. PRR is one of Old Sundanese literature which were written in the sixteenth century AD. The story tells the war between the son of Rama, King of Lengkawati and the son of Rawana, the king of Lengkapura which took place after Rawana passed away and Rama attained moksha. The PRR manuscripts of Kabuyutan Ciburuy are scattered in six kropaks which leaves (lempir) are mixed with leaves from other texts. The first groups, which are consisted of Kropak 17, Kropak 18, Kropak 22, the fourth leaf, and Kropak 26, is called Manuscript A. The second groups, which are consisted of Kropak 24, the third leaf of Kropak 26, and the fifth leaf of Kropak 29, is called Manuscript C. Moreover, the PRR text which h...
Naskah sebagai salah satu peninggalan masa lampau di dalamnya mengandung nilai-nilai kemanusiaan ... more Naskah sebagai salah satu peninggalan masa lampau di dalamnya mengandung nilai-nilai kemanusiaan yang merupakan hasil karya, karsa, dan cipta para nenek moyang. Naskah pun dapat dianggap sebagai salah satu sumber yang memiliki otoritas dalam memberikan berbagai informasi mengenai masa lampau. Dalam hal ini yang dimaksud dengan naskah adalah peninggalan dalam bentuk tulisan tangan. Naskah di Nusantara jumlahnya cukup melimpah bahkan untuk naskah Sunda saja, saat ini terkumpul dalam berbagai perpustakaan di dunia hampir mendekati angka 1.500 buah naskah. Jumlah tersebut kemungkinan akan semakin bertambah bila mengingat masih ada naskah-naskah yang menjadi koleksi perseorangan. Namun di balik itu, naskah pun akan berangsur-angsur berkurang karena materi naskah bukanlah bahan yang tahan lama apalagi kondisi iklim Indonesia yang tropis menyebabkan mudah terjadinya pelapukan. Oleh karena itu, naskah-naskah tersebut perlu secepatnya mendapatkan uluran tangan dari para peneliti agar kandung...
The research of script on manuscripts (Sundanese manuscript) has long been done. One reason is be... more The research of script on manuscripts (Sundanese manuscript) has long been done. One reason is because in philological work, the step of script description used for the study object is a mandatory. In almost every philological research, the section of script comparison used in the manuscript (which is used as the study object) with similar script that have been studied previously, must be found. The activity results in the revelation of the script uniqueness exists in the researched manuscript. Although these studies have contributed considerably to ease the reading of Sundanese script in other Old Sundanese manuscripts, there has not been much information on the causes of variations in Old Sundanese script. One cause is the disorganized data (the data is separated). In this paper, we will describe an application that we designed to do the indexing of Old Sundanese script. In this first stage, we use data from Old Sundanese manuscripts from Kabuyutan Ciburuy Garut. It is expected th...
adalah jurnal ilmiah yang dikelola oleh Masyarakat Pernaskahan Nusantara (Manassa), asosiasi prof... more adalah jurnal ilmiah yang dikelola oleh Masyarakat Pernaskahan Nusantara (Manassa), asosiasi profesi pertama dan satu-satunya di Indonesia yang memperhatikan pengkajian dan pelestarian naskah Nusantara. Jurnal ini dimaksudkan sebagai media pembahasan ilmiah dan penyebarluasan hasil penelitian di bidang filologi, kodikologi, dan paleografi. Terbit dua kali dalam setahun.
AbstrakSejak diluncurkannya font aksara Sunda Unicode (SundaneseLatin) pada tahun2008, penggunaan... more AbstrakSejak diluncurkannya font aksara Sunda Unicode (SundaneseLatin) pada tahun2008, penggunaan aksara Sunda mulai memasuki wilayah-wilayah baru. AksaraSunda yang sebelumnya hanya ditemukan pada buku-buku dan karya seni, kinimulai digunakan untuk penulisan nama diri, instansi, jalan, dll. Bahkan, tidak sedikitjuga digunakan sebagai media kreativitas pada benda-benda untuk kepentingankomersial seperti pada kaus, stiker, dll. Namun, keberadaan font SundaneseLatin inidi sisi lain dikhawatirkan akan menimbulkan kesalahan hasil tik aksara Sunda. Haltersebut di antaranya disebabkan adanya perbedaan teknik pengetikan aksara Sundadi komputer dan kurang pahamnya masyarakat pengguna terhadap aksara Sunda itusendiri. Aksara Sunda yang bersifat silabis (satu lambang satu suku kata) memilikiteknik pengetikan yang berbeda pada komputer yang memiliki sifat pengetikan secarafonetis. Akibatnya, pada hasil ketikan font aksara Sunda sering ditemukan kesalahanmeskipun sebenarnya pada saat peluncuran ...
Kreativitas dalam pengembangan berbagai hal berbasis komputer tidak hanya berlaku pada wilayah-wi... more Kreativitas dalam pengembangan berbagai hal berbasis komputer tidak hanya berlaku pada wilayah-wilayah kehidupan primer (utama) tetapi merambah juga ke wilayah-wilayah sekunder seperti bidang bahasa daerah. Bahasa daerah yang saat ini keberadaannya terus tersisihkan oleh para pencintanya terus dikembangkan salah satunya dengan memanfaatkan Information and Comunication Technology (ICT). Wujud nyata dari usaha tersebut di antaranya dengan dibuatnya beberapa font aksara daerah, seperti font aksara Sunda. Kemunculan font aksara Sunda ini sangat penting bagi perkembangan bahasa Sunda karena pada dasarnya aksara daerah merupakan alat rekam yang tepat bagi bahasa daerah tersebut (Baidilah dkk., 2008). Hampir di setiap wilayah di Jawa Barat aksara Sunda dapat ditemui pada nama-nama jalan, instansi, ataupun produk-produk kreatif. Kemunculan aksara Sunda di berbagai media tersebut tentunya tidak lepas dari peran font aksara Sunda Unicode (IB80-IBBF) yang mempermudah masyarakat dalam menulis ...
Uploads
Books by Rahmat Sopian
Papers by Rahmat Sopian