ISO 639-3 - ISO 639-3

Dari Wikipedia, Ensiklopedia Gratis

Pin
Send
Share
Send

ISO 639-3: 2007, Kode untuk representasi nama bahasa - Bagian 3: Kode Alpha-3 untuk cakupan bahasa yang komprehensif, adalah standar internasional untuk kode bahasa dalam ISO 639 seri. Ini mendefinisikan kode tiga huruf untuk mengidentifikasi bahasa. Standar tersebut diterbitkan oleh Organisasi Internasional untuk Standardisasi (ISO) pada 1 Februari 2007.[1]

ISO 639-3 memperluas ISO 639-2 kode alpha-3 dengan tujuan untuk mencakup semua yang diketahui bahasa alami. Cakupan bahasa yang diperluas terutama didasarkan pada kode bahasa yang digunakan di Ethnologue (volume 10-14) diterbitkan oleh SIL Internasional, yang sekarang menjadi Otoritas Registrasi untuk ISO 639-3.[2] Ini memberikan penghitungan bahasa selengkap mungkin, termasuk yang hidup dan punah, kuno dan dibangun, besar dan kecil, tertulis dan tidak tertulis.[1] Namun, itu tidak termasuk bahasa yang direkonstruksi seperti Proto-Indo-Eropa.[3]

ISO 639-3 dimaksudkan untuk digunakan sebagai metadata kode dalam berbagai aplikasi. Ini banyak digunakan di komputer dan sistem informasi, seperti Internet, di mana banyak bahasa perlu didukung. Dalam arsip dan penyimpanan informasi lainnya, ini digunakan dalam sistem katalog, menunjukkan bahasa apa sumber daya itu atau tentang. Kode-kode tersebut juga sering digunakan dalam literatur linguistik dan di tempat lain untuk mengimbangi fakta bahwa nama bahasa mungkin tidak jelas atau ambigu.

Temukan bahasa
Masukkan kode ISO 639-3 untuk menemukan artikel bahasa yang sesuai.

Kode bahasa

ISO 639-3 mencakup semua bahasa dalam ISO 639-1 dan semua bahasa individu di ISO 639-2. ISO 639-1 dan ISO 639-2 berfokus pada bahasa utama, yang paling sering ditampilkan dalam keseluruhan literatur dunia. Karena ISO 639-2 juga termasuk koleksi bahasa dan Bagian 3 tidak, ISO 639-3 bukanlah superset dari ISO 639-2. Dimana Kode B dan T. ada di ISO 639-2, ISO 639-3 menggunakan kode-T.

Contoh kode bahasa ISO
Bahasa639-1639-2 (B / T)639-3 tipe639-3 kode
Inggrisenengindividueng
Jermandeger / deuindividudeu
Arabararamakroara
individuarb + lainnya
Cinazhchi / zho[4][5]makrozho
Mandarinindividucmn
Bahasa Kantonindividuyue
Minnanindividunan

Per 30 Januari 2020, standar berisi 7.868 entri.[6] Inventarisasi bahasa didasarkan pada sejumlah sumber termasuk: bahasa individu yang terdapat dalam 639-2, bahasa modern dari Ethnologue, varietas bersejarah, bahasa kuno dan bahasa buatan dari Daftar Ahli Bahasa,[7] serta bahasa yang direkomendasikan dalam periode komentar publik tahunan.

Data yang dapat dibaca mesin file disediakan oleh otoritas pendaftaran.[6] Pemetaan dari ISO 639-1 atau ISO 639-2 ke ISO 639-3 dapat dilakukan menggunakan file data ini.

ISO 639-3 dimaksudkan untuk mengasumsikan perbedaan berdasarkan kriteria yang tidak sepenuhnya subjektif.[8] Ini tidak dimaksudkan untuk mendokumentasikan atau memberikan pengenal untuk dialek atau variasi sub-bahasa lainnya.[9] Namun demikian, penilaian mengenai perbedaan antara bahasa mungkin subjektif, terutama dalam kasus ragam bahasa tanpa tradisi sastra yang mapan, penggunaan dalam pendidikan atau media, atau faktor lain yang berkontribusi pada konvensionalisasi bahasa. Oleh karena itu, standar tidak boleh dianggap sebagai pernyataan otoritatif tentang bahasa yang berbeda yang ada di dunia (tentang yang mungkin ada ketidaksepakatan substansial dalam beberapa kasus), melainkan hanya satu cara yang berguna untuk mengidentifikasi ragam bahasa yang berbeda secara tepat.

Ruang kode

Karena kodenya adalah alfabet tiga huruf, satu batas atas untuk jumlah bahasa yang dapat direpresentasikan adalah 26 × 26 × 26 = 17.576. Karena ISO 639-2 mendefinisikan kode khusus (4), rentang yang dicadangkan (520) dan kode B-only (22), kode 546 tidak dapat digunakan di bagian 3. Oleh karena itu, batas atas yang lebih ketat adalah 17.576 - 546 = 17.030.

Batas atas menjadi lebih ketat jika mengurangi koleksi bahasa yang ditentukan di 639-2 dan yang belum ditentukan di ISO 639-5.

Macrolanguages

Ada 58 bahasa di ISO 639-2 yang dianggap, untuk tujuan standar, sebagai "macrolanguages" dalam ISO 639-3.[10]

Beberapa di antaranya macrolanguages tidak memiliki bahasa individual seperti yang didefinisikan oleh ISO 639-3 dalam kumpulan kode ISO 639-2, mis. 'ara' (Bahasa Arab Generik). Orang lain seperti 'nor' (Norwegia) memiliki dua bagian individu ('nno' (Nynorsk), 'nob' (Bokmål)) sudah dalam ISO 639-2.

Artinya, beberapa bahasa (misalnya 'arb', Bahasa Arab Standar) yang dianggap oleh ISO 639-2 sebagai dialek dari satu bahasa ('ara') sekarang ada dalam ISO 639-3 dalam konteks tertentu yang dianggap sebagai bahasa individual itu sendiri.

Ini adalah upaya untuk menangani ragam yang mungkin secara linguistik berbeda satu sama lain, tetapi diperlakukan oleh penuturnya sebagai dua bentuk bahasa yang sama, mis. dalam kasus diglossia.

Sebagai contoh:

Lihat[11] untuk daftar lengkapnya.

Bahasa kolektif

"Elemen kode bahasa kolektif adalah pengenal yang mewakili sekelompok bahasa individu yang tidak dianggap sebagai satu bahasa dalam konteks penggunaan apa pun."[12] Kode-kode ini tidak secara tepat mewakili bahasa atau bahasa makro tertentu.

Meskipun ISO 639-2 menyertakan pengidentifikasi tiga huruf untuk bahasa kolektif, kode ini dikecualikan dari ISO 639-3. Karenanya ISO 639-3 bukanlah superset dari ISO 639-2.

ISO 639-5 mendefinisikan kode kolektif 3 huruf untuk kelompok dan kelompok bahasa, termasuk kode bahasa kolektif dari ISO 639-2.

Kode khusus

Empat kode disisihkan ISO 639-2 dan ISO 639-3 untuk kasus di mana tidak ada kode spesifik yang sesuai. Ini dimaksudkan terutama untuk aplikasi seperti database di mana kode ISO diperlukan terlepas dari apakah ada.

  • salah (bahasa yang tidak dikodekan, awalnya merupakan singkatan dari 'miscellaneous') ditujukan untuk bahasa yang belum (belum) dimasukkan dalam standar ISO.
  • mul (beberapa bahasa) ditujukan untuk kasus di mana data menyertakan lebih dari satu bahasa, dan (misalnya) database memerlukan satu kode ISO.
  • und (tidak ditentukan) ditujukan untuk kasus-kasus di mana bahasa dalam data belum teridentifikasi, seperti ketika salah label atau tidak pernah diberi label. Ini tidak dimaksudkan untuk kasus-kasus seperti Trojan di mana bahasa yang belum diuji telah diberi nama.
  • zxx (tidak ada konten linguistik / tidak berlaku) dimaksudkan untuk data yang sama sekali bukan bahasa, seperti panggilan binatang.[13]

Selain itu, 520 kode dalam jangkauan qaaqtz 'disediakan untuk penggunaan lokal'. Misalnya, file Daftar Ahli Bahasa menggunakannya untuk bahasa yang punah. Daftar Ahli Bahasa telah menetapkan salah satunya nilai umum: qnp, bahasa asli tanpa nama. Ini digunakan untuk node perantara yang diusulkan dalam pohon keluarga yang tidak memiliki nama.

Proses pemeliharaan

Tabel kode untuk ISO 639-3 terbuka untuk perubahan. Untuk melindungi stabilitas penggunaan yang ada, perubahan yang diizinkan dibatasi pada:[14]

  • modifikasi informasi referensi untuk suatu entri (termasuk nama atau kategorisasi untuk jenis dan cakupan),
  • penambahan entri baru,
  • penghentian entri yang duplikat atau palsu,
  • menggabungkan satu atau lebih entri ke entri lain, dan
  • membagi entri bahasa yang ada menjadi beberapa entri bahasa baru.

Kode yang ditetapkan ke suatu bahasa tidak diubah kecuali ada juga perubahan dalam denotasi.[15]

Perubahan dilakukan pada siklus tahunan. Setiap permintaan diberikan jangka waktu minimal tiga bulan untuk tinjauan publik.

Situs web ISO 639-3 memiliki halaman yang menjelaskan "cakupan denotasi"[16] (lesu jenis) dan jenis bahasa,[17] yang menjelaskan konsep apa yang ada dalam cakupan pengkodean dan kriteria tertentu yang perlu dipenuhi. Misalnya, bahasa buatan dapat dienkode, tetapi hanya jika dirancang untuk komunikasi manusia dan memiliki badan literatur, mencegah permintaan untuk penemuan istimewa.

Dokumen otoritas pendaftaran di situs Web-nya dibuat dalam teks standar ISO 639-3 tentang bagaimana tabel kode harus dipelihara.[18] Ini juga mendokumentasikan proses yang digunakan untuk menerima dan memproses permintaan perubahan.[19]

Formulir permintaan perubahan disediakan, dan ada formulir kedua untuk mengumpulkan informasi tentang penambahan yang diusulkan. Setiap pihak dapat mengirimkan permintaan perubahan. Saat dikirim, permintaan pada awalnya ditinjau oleh otoritas pendaftaran untuk kelengkapan.

Ketika permintaan yang didokumentasikan sepenuhnya diterima, itu ditambahkan ke Indeks Permintaan Perubahan yang diterbitkan. Selain itu, pengumuman dikirim ke daftar diskusi LINGUIST umum di Daftar Ahli Bahasa dan daftar lain yang mungkin dianggap relevan oleh otoritas pendaftaran, mengundang tinjauan publik dan masukan tentang perubahan yang diminta. Setiap pemilik daftar atau individu dapat meminta pemberitahuan permintaan perubahan untuk wilayah atau rumpun bahasa tertentu. Komentar yang diterima diterbitkan untuk ditinjau oleh pihak lain. Berdasarkan konsensus dalam komentar yang diterima, permintaan perubahan dapat ditarik atau dipromosikan menjadi "status kandidat".

Tiga bulan sebelum akhir siklus tinjauan tahunan (biasanya pada bulan September), pengumuman ditetapkan ke daftar diskusi LINGUIST dan daftar lain terkait Permintaan Perubahan Status Kandidat. Semua permintaan tetap terbuka untuk ditinjau dan dikomentari hingga akhir siklus tinjauan tahunan.

Keputusan diumumkan pada akhir siklus tinjauan tahunan (biasanya pada bulan Januari). Pada saat itu, permintaan dapat diadopsi seluruhnya atau sebagian, diubah dan diteruskan ke siklus peninjauan berikutnya, atau ditolak. Penolakan sering kali menyertakan saran tentang cara mengubah proposal untuk pengiriman ulang. Arsip publik dari setiap permintaan perubahan disimpan bersama dengan keputusan yang diambil dan alasan pengambilan keputusan.[20]

Kritik

Ahli bahasa Morey, Post dan Friedman mengajukan berbagai kritik terhadap ISO 639, dan khususnya ISO 639-3:[15]

  • Kode tiga huruf itu sendiri bermasalah, karena meskipun secara resmi merupakan label teknis yang sewenang-wenang, kode itu sering kali berasal dari singkatan mnemonik untuk nama bahasa, beberapa di antaranya merendahkan. Sebagai contoh, Yemsa diberi kode jnj, dari kata merendahkan "Janejero". Oleh karena itu, kode ini dapat dianggap menyinggung oleh penutur asli, tetapi kode dalam standar, setelah ditetapkan, tidak dapat diubah.
  • Administrasi standar bermasalah karena SIL adalah organisasi misionaris dengan transparansi dan akuntabilitas yang tidak memadai. Keputusan tentang apa yang pantas untuk dikodekan sebagai bahasa dibuat secara internal. Meskipun masukan dari luar mungkin diterima atau tidak diterima, keputusannya sendiri tidak jelas, dan banyak ahli bahasa telah menyerah untuk mencoba meningkatkan standar.
  • Identifikasi permanen suatu bahasa tidak sesuai dengan perubahan bahasa.
  • Bahasa dan dialek seringkali tidak dapat dibedakan secara ketat, dan dialek continua dapat dibagi lagi dalam banyak hal, sedangkan keistimewaan standar satu pilihan. Perbedaan tersebut seringkali didasarkan pada faktor sosial dan politik.
  • ISO 639-3 dapat disalahpahami dan disalahgunakan oleh otoritas yang mengambil keputusan tentang identitas dan bahasa orang, menghapus hak pembicara untuk mengidentifikasi atau mengidentifikasi dengan variasi ucapan mereka. Meskipun SIL sensitif terhadap masalah seperti itu, masalah ini melekat pada sifat standar yang ditetapkan, yang dapat digunakan (atau salah digunakan) dengan cara yang tidak diinginkan oleh ISO dan SIL.

Martin Haspelmath setuju dengan empat poin ini, tetapi bukan poin tentang perubahan bahasa.[21] Dia tidak setuju karena akun bahasa apa pun memerlukan pengidentifikasiannya, dan kita dapat dengan mudah mengidentifikasi berbagai tahapan bahasa. Dia menyarankan bahwa ahli bahasa mungkin lebih suka menggunakan kodifikasi yang dibuat di lesu tingkat karena "jarang menjadi masalah bagi ahli bahasa apakah yang mereka bicarakan adalah bahasa, dialek atau rumpun bahasa yang erat." Dia juga mempertanyakan apakah standar ISO untuk identifikasi bahasa sudah sesuai karena ISO adalah organisasi industri, sementara dia memandang dokumentasi dan nomenklatur bahasa sebagai upaya ilmiah. Dia mengutip kebutuhan asli untuk pengidentifikasi bahasa standar sebagai "makna ekonomi terjemahan dan pelokalan perangkat lunak, "untuk tujuan mana standar ISO 639-1 dan 639-2 ditetapkan. Namun ia menimbulkan keraguan tentang kebutuhan industri akan cakupan komprehensif yang disediakan oleh ISO 639-3, termasuk seperti yang dilakukannya" bahasa yang kurang dikenal dari komunitas kecil yang tidak pernah atau hampir tidak pernah digunakan dalam tulisan dan yang sering terancam punah ".

Pemakaian

  • Ethnologue
  • Daftar Ahli Bahasa
  • OLAC: Komunitas Arsip Bahasa Terbuka[22]
  • Microsoft Windows 8:[23] Mendukung semua kode dalam ISO 639-3 pada saat rilis.
  • Yayasan Wikimedia: Proyek berbasis bahasa baru (misalnya Wikipedias dalam bahasa baru) harus memiliki pengenal dari ISO 639-1, -2, atau -3.[24]
  • Standar lain yang mengandalkan ISO 639-3:

Referensi

  1. ^ Sebuah b "Status dan abstrak ISO 639-3". iso.org. 2010-07-20. Diakses 2012-06-14.
  2. ^ "Agen pemeliharaan dan otoritas pendaftaran". ISO.
  3. ^ "Jenis bahasa individu - Bahasa kuno". sil.org. Diakses 2018-06-11.
  4. ^ Laporan Ethnologue untuk kode ISO 639: zho Diarsipkan 2014-09-12 di Mesin Wayback di ethnologue.com
  5. ^ ISO639-3 di SIL.org
  6. ^ Sebuah b "Kumpulan Kode ISO 639-3". Sil.org. 2007-10-18. Diakses 2012-06-14.
  7. ^ "ISO 639-3". sil.org.
  8. ^ "Cakupan Denotasi: Bahasa Individual". sil.org.
  9. ^ "Ruang Lingkup Denotasi: Dialek". sil.org.
  10. ^ "Ruang lingkup denotasi: Macrolanguages". sil.org. Diakses 2012-06-14.
  11. ^ "Pemetaan Bahasa Macro". sil.org. Diakses 2012-06-14.
  12. ^ "Ruang lingkup denotasi: Bahasa kolektif". sil.org. Diakses 2012-06-14.
  13. ^ Rekaman Lapangan Panggilan Monyet Vervet. Entri dalam katalog Konsorsium Data Linguistik. Diakses tanggal 04-09 2012.
  14. ^ "Mengirimkan Permintaan Perubahan ISO 639-3: Jenis Perubahan". sil.org.
  15. ^ Sebuah b Morey, Stephen; Posting, Mark W .; Friedman, Victor A. (2013). Kode bahasa ISO 639: A prematur, akhirnya tidak dapat diperoleh, dan mungkin merusak standardisasi. Konferensi RRR PARADISEC. Diarsipkan dari asli pada 2016-02-23. Diakses 2015-11-03.
  16. ^ "Lingkup Denotasi untuk Pengenal Bahasa". sil.org.
  17. ^ "Jenis Bahasa". sil.org.
  18. ^ "Manajemen Perubahan ISO 639-3". sil.org.
  19. ^ "Mengirimkan Permintaan Perubahan ISO 639-3". sil.org.
  20. ^ "ISO 639-3 Ubah Indeks Permintaan". sil.org.
  21. ^ Martin Haspelmath, "Dapatkah identitas bahasa distandarisasi? Pada kritik Morey et al. Terhadap ISO 639-3", Diversity Linguistics Comment, 2013/12/04
  22. ^ "Ekstensi Bahasa OLAC". language-archives.org. Diakses 3 Agustus 2015.
  23. ^ "Lebih dari 7.000 bahasa, hanya 1 Windows". Microsoft. 2014-02-05.
  24. ^ "Kebijakan proposal bahasa". wikimedia.org. Diakses 3 Agustus 2015.
  25. ^ "BCP 47 - Tag untuk Mengidentifikasi Bahasa". ietf.org. Diakses 3 Agustus 2015.
  26. ^ Sebuah b "EPUB Publications 3.0". idpf.org. Diakses 3 Agustus 2015.
  27. ^ "Persyaratan Metadata DCMI". purl.org. Diakses 3 Agustus 2015.
  28. ^ "Kode bahasa ISO dua huruf atau tiga huruf". w3.org. Diakses 3 Agustus 2015.
  29. ^ "Bahasa Registry". Iana.org. Diakses 2015-08-12.
  30. ^ "3 Semantik, struktur, dan API dokumen HTML - HTML5". w3.org. Diakses 3 Agustus 2015.
  31. ^ "Elemen - Panduan Pengguna MODS: Skema Deskripsi Objek Metadata: MODS (Library of Congress)". loc.gov. Diakses 3 Agustus 2015.
  32. ^ "Bahasa elemen TEI". tei-c.org. Diakses 3 Agustus 2015.

Bacaan lebih lanjut

Tautan luar

Pin
Send
Share
Send