Dewan Bahasa dan Pustaka
Menu Tutup

Pangkalan Data Korpus

PENGENALAN

  1. Sistem Korpus DBP telah dibina dan siap sepenuhnya pada tahun 1995 melalui kerjasama Universiti Sains Malaysia (USM) dan Dewan Bahasa dan Pustaka (DBP).
  2. Sistem ini dilengkapi dengan kemudahan untuk menganalisis konkordans, teks bahasa Melayu, mengoutput kata berimbuhan, memilih teks yang hendak dianalisis, mengisih data, menyimpan data dan melihat teks dalam bentuk ayat dan perenggan.
  3. Pada awalnya, pangkalan data ini bersifat luar talian (offline) iaitu para penyelidik perlu berkunjung ke DBP untuk mengakses data. Walaubagaimanapun, pada tahun 2000, sistem korpus lama telah digantikan dengan sistem korpus yang baharu dan boleh diakses melalui internet.
  4. Tahun 2010, korpus DBP boleh diakses melalui sistem yang baharu melalui projek Sistem Bahasa Melayu Bersepadu (SBMB) iaitu Korpus DBP.

OBJEKTIF

Pembinaan pangkalan data korpus ini adalah untuk menyediakan suatu prasarana penelitian yang autentik sifatnya kepada para penyelidik bahasa Melayu agar dapatan yang diperoleh daripada kajian berdasarkan korpus ini dapat mencerminkan perilaku dan pola leksikal bahasa Melayu dalam persekitaran penggunaannya yang sebenar, dan dapat pula dijadikan asas untuk penyusunan kamus, tatabahasa dan buku-buku bahasa yang lain.

FUNGSI

  1. Penelitian perbendaharaan kata dan istilah bahasa Melayu seperti analisis teks, analisis kekerapan kata, pengekodan kelas kata dan seumpamanya.
  2. Pengumpulan, pengekodan dan pemasukan teks bahasa Melayu ke dalam pangkalan data teks sebagai wadah dan sumber data yang besar untuk penelitian dan penyebaran.
  3. Penelitian yang berkaitan dengan linguistik komputeran, pemprosesan bahasa tabii dan pengurusan pangkalan data dengan tujuan melengkapkan dan mencerdaskan sistem bahasa Melayu melalui penerapan teknologi bahasa.

DATA KORPUS DBP

STATISTIK

Sehingga Mei 2024, seramai 10,739 penyelidik telah berdaftar di dalam Sistem Korpus DBP.

  1. Pengguna Awam tidak perlu mendaftar untuk menggunakan Korpus DBP. Pengguna hanya perlu memasukkan kata kunci pada kotak carian, dan baris konkordans akan dipaparkan.
  2. Penyelidik boleh mendaftar untuk menggunakan kemudahan Korpus DBP yang lebih khusus seperti analisis kekerapan kata, analisis panjang ayat dan panjang kata.

Sehingga Mei 2024, sebanyak 135,546,484 juta kata telah dimasukkan ke dalam pangkalan data korpus.

Sehingga Mei 2024, sebanyak 119,640 bahan yang terdiri daripada buku, teks sastera, majalah, kertas kerja, akhbar dan efemeral telah dimasukkan ke dalam sistem pangkalan data korpus DBP.

URUS SETIA

Puan Nor Azianti binti Abd Aziz
Bahagian Peristilahan dan Leksikologi
Dewan Bahasa dan Pustaka

Telefon: 03-21479158
E-mel: azianti@dbp.gov.my

Puan Nurshuhaida binti Mohd Aris
Bahagian Peristilahan dan Leksikologi
Dewan Bahasa dan Pustaka

Telefon: 03-21479167
E-mel: shuhaida@dbp.gov.my

Puan Farah Shazwani binti Nor
Bahagian Peristilahan dan Leksikologi
Dewan Bahasa dan Pustaka

Telefon: 03-21479172
E-mel: farah@dbp.gov.my

Total Views: 4986 ,

MAKLUM BALAS

Skip to content