Dalam kajian linguistik kita sering mendengar istilah korpus (corpus). Akan tetapi seringkali masih ada kesulitan untuk membedakan antara korpus dengan teks.
Korpus dalam bahasa Inggris corpus artinya kumpulan teks. Menurut Baker (2010:93) korpus merupakan kumpulan teks baik tulisan lisan maupun lisan yang tersimpan dalam komputer.
Dari pengertian tersebut dapat disimpulkan bahwa korpus merupakan kumpulan teks baik lisan maupun tulis yang ada di media cetak maupun elektronik dan dapat dijadikan sumber data.
Selanjutnya, korpus dapat dikatakan bahwa suatu sumber data yang sudah ada. Sumber data yang berisi unit linguistik yang sudah siap untuk diteliti.
Pada sudut pandang lain, korpus juga dapat dibangun, yakni seorang dapat mengumpulkan korpus baik bersumber dari lisan maupun tulis. Sumber lisan berupa rekaman, wawancara, dan diskusi.
Sumber tertulis berupa buku, novel, koran, majalah, web, blog, jurnal, dan lain sebagainya. Setelah teks dikumpulkan, selanjutnya menjadi satu kumpulan data yang disebut korpus.
Referensi
- Baker, P. (2010). Corpus Methods in Linguistics. In Litosseliti, Lia. 2010. Research Methods in Linguistics. New York: Continnum International Publishing Group.
- Setiawan, T. (2017). Linguistik Korpus dalam Pengajaran Bahasa. Makalah, disajikan dalam seminar nasional Perspektif Baru Penelitian Linguistik Terapan, tanggal 6 Juni 2017 di Program Pascasarjana, Universitas Negeri Yogyakarta.
corpus sendiri itu apa sama dengan penelitian quantitative min???
Terimakasih ilmunya kawan