ISO 639

Da Wikipedia, l'enciclopedia libera.
Jump to navigation Jump to search

ISO 639 è uno standard internazionale per la classificazione dei linguaggi e dei gruppi di linguaggi, e attribuisce loro un codice identificativo univoco.

Lo scopo dell'ISO 639 è creare un catalogo universalmente riconosciuto di codici convenzionali che vengono univocamente associati ai singoli linguaggi senza ambiguità. Il termine linguaggio include diverse forme di comunicazione non solo limitate alle lingue parlate ma include anche lingue estinte o storiche, gruppi linguistici o macro-lingue o macro-linguaggi, varianti linguistiche, dialetti come anche forme di comunicazione non parlata come il linguaggio dei segni. Sono invece esclusi i linguaggi usati in campo informatico.

L'ISO 639 è stato approvato per la prima volta nel 1967, ma si compone di differenti sezioni (numerate da -1 a -6) che sono state pubblicate e aggiornate più volte nel corso degli anni fino al XXI secolo estendendo di volta in volta la precedente versione ISO. Gli standard più comunemente utilizzati sono l'ISO 639-1 e l'ISO 639-3.

I codici identificatori forniti dall'ISO 639 possono essere utilizzati in molti ambiti e applicazioni, ad esempio per indicare in che linguaggio è scritto un testo o un sito web, per identificare la lingua di provenienza di un termine definito in un dizionario, i linguaggi gestiti da un software, la denominazione di una località, ecc. Per questo motivo l'ISO 639 trova largo impiego nel campo dell'informatica, del web design, e nella gestione degli archivi bibliografici.

Caratteristiche dei codici[modifica | modifica wikitesto]

I codici ISO individuano i seguenti linguaggi:

  • Linguaggi individuali
  • Macro-linguaggi (parte 3)
  • Collezione di linguaggi (parte 1, 2, 5)
  • Dialetti
  • Linguaggi riservati per uso locale (parte 2, 3)
  • Casi speciali (parte 2, 3)

Tipi (per linguaggi individuali):

  • Lingue in uso (parte 2, 3) (tutti i macro-linguaggi sono linguaggi in uso)
  • Lingue estinte (parte 2, 3)
  • Lingue antiche (parte 1, 2, 3)
  • Lingue storiche (parte 2, 3)
  • Lingue artificiali (parte 2, 3)

Codici bibliografici e terminologici:

  • Bibliografie (parte 2)
  • Terminologie (parte 2)

ISO 639-1[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svgLo stesso argomento in dettaglio: ISO 639-1.
  • ISO 639-1:2002: Codici per la rappresentazione dei nomi dei linguaggi -- Parte 1: Alpha-2 code.

Questa sezione utilizza codici di 2 lettere (alpha-2) per identificare i principali linguaggi (o famiglie di linguaggi) del pianeta, fornendo un catalogo generale di massima che si compone di 136 elementi.

Si tratta di codici largamente diffusi e utilizzati internazionalmente per riferirsi soprattutto alle principali lingue del mondo (ad esempio: (EN) , (IT) , (DE) , eccetera). Si tratta di lingue che per la maggior parte sono presenti nella letteratura contemporanea.

La versione aggiornata di questo standard è stata pubblicata nel 2002, e l'ultimo codice identificativo aggiunto dopo la pubblicazione risale al 2003.

ISO 639-2[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svgLo stesso argomento in dettaglio: ISO 639-2.
  • ISO 639-2:1998: Codici per la rappresentazione dei nomi dei linguaggi -- Parte 2: Alpha-3 code.

La catalogazione più generale dell'ISO 639-1 è approfondita nell'ISO 639-2, che utilizza codici di 3 lettere (alpha-3) per consentire un maggior numero di combinazioni possibili e permettere una maggiore differenziazione nel numero e nel tipo di linguaggi. Oltre alle singole lingue, l'ISO 639-2 fornisce inoltre codici identificativi per le famiglie linguistiche (ad esempio le lingue sino-tibetane o le lingue celtiche) e per le cosiddette macro-linguaggi, per i dialetti, per lingue e linguaggi estinti, antichi o artificiali. Il termine macro-linguaggio (in inglese macrolanguage) si riferisce a un oggetto che in certi contesti può per praticità di analisi venire considerato come un'unica lingua o linguaggio, ma che in realtà è un insieme che raccoglie dei sottotipi evoluti (come è il caso del cinese che raccoglie sottotipi eterogenei e distinti come il cantonese, o del pashtu). La catalogazione dei macro-linguaggi viene perfezionata a partire dal successivo standard ISO 693-3.

L'indice ISO 639-2 comprende 464 codici identificativi.

Questo indice è stato sostanzialmente superato dalla catalogazione ancor più estesa e dettagliata fornita dall'ISO 639-3. Ad eccezione delle famiglie linguistiche (che vengono per la maggior parte recuperate nell'ISO 639-5), infatti tutti gli elementi dell'ISO 639-2 sono stati ricodificati e inseriti nell'ISO 639-3.

Pubblicato per la prima volta nel 1998, è stato aggiornato con nuovi elementi fino al 1999.

ISO 639-3[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svgLo stesso argomento in dettaglio: ISO 639-3.
  • ISO 639-3:2007: Codici per la rappresentazione dei nomi dei linguaggi -- Parte 3: Alpha-3 code for comprehensive coverage of languages

L'ISO 639-3 ha l'obiettivo di costruire un indice generale e il più dettagliato possibile, che comprenda qualunque tipo di linguaggio naturale esistente al mondo.

L'indice ISO 639-3 assegna codici di 3 lettere (alpha-3) a un vasto catalogo di lingue moderne, antiche, estinte e persino artificiali, per un totale di 7776 elementi.

L'ISO 639-3 è progettato per non entrare in conflitto con l'ISO 639-2. Per questo, tutti gli elementi presenti nell'ISO 639-2 sono dotati di un nuovo codice identificativo (ad eccezione delle famiglie linguistiche, escluse dall'ISO 639-3 e reintrodotte solo nel più tardo ISO 693-5).

lingua codice
639-1
codice
639-2
Dominio
639-3
codice
639-3
Inglese en eng a sé stante eng
Tedesco de ger/deu a sé stante deu
Arabo ar ara macrolingua ara
a sé stante arb + altri
Lingua cinese zh chi/zho[1][2] macrolingua zho
Mandarino a sé stante cmn
Cantonese a sé stante yue
Min Nan a sé stante nan

L'ISO 639-3 è stato pubblicato nel 2007.

Novità dell'ISO 639-3[modifica | modifica wikitesto]

L'ISO 639-3 rappresenta un tentativo di costruzione di un indice dei linguaggi assai più dettagliato, che come i precedenti tiene conto della letteratura prodotta nelle varie lingue, ma si differenzia nel cercare di rendere conto in maniera più articolata della situazione concreta dei linguaggi parlati. Le principali caratteristiche dell'ISO 639-3 sono:

  • L'inserimento nell'indice di molte più macro-linguaggi. Questo comprende sia nuovi elementi, che elementi già codificati in precedenza. Nello specifico, vi sono 56 elementi che nell'ISO 639-2 erano catalogati come linguaggi, e che nell'ISO 639-3 sono stati invece catalogati come macro-linguaggi. Ciò fa sì che in determinati contesti un linguaggio, che in precedenza veniva considerati come semplice variante di un linguaggio ISO 639-2, secondo lo standard ISO 639-3 può esser considerato un linguaggio a sé stante.
  • La differenza di trattamento riservata alle famiglie linguistiche, una cui prima indicizzazione era stata già intrapresa con l'ISO 639-2. Questi elementi sono stati totalmente esclusi dall'ISO 639-3, che si concentra esclusivamente su linguaggi e macro-linguaggi. Le famiglie linguistiche sono re-indicizzate solo con il successivo ISO 639-5.

ISO 639-4[modifica | modifica wikitesto]

  • ISO 639-4:2010: Codici per la rappresentazione dei nomi dei linguaggi -- Parte 4: Linee guida e principi generali di implementazione per la codifica dei linguaggi

Questo documento stabilisce le linee guida per l'utilizzo dell'ISO 639, e contiene i criteri per l'attribuzione dei codici linguistici. Anche le sezioni 1, 2, 3 e 5 dell'ISO 639 contengono istruzioni relative a come applicare lo standard, ma la sezione 4 intende fornire una descrizione complessiva ed esaustiva delle regole di utilizzo e delle linee guida presupposte da questa codifica ISO.

Il documento è stato pubblicato nel 2010.

ISO 639-5[modifica | modifica wikitesto]

Magnifying glass icon mgx2.svgLo stesso argomento in dettaglio: ISO 639-5.
  • ISO 639-5:2008: Codici per la rappresentazione dei nomi dei linguaggi -- Parte 5: Alpha-3 code. Codifica per le famiglie ed i gruppi linguistici

L'ISO 639-5 utilizza codici di 3 lettere (alpha-3) per codificare un totale di 114 famiglie linguistiche e gruppi linguistici, siano essi viventi o estinti. Premesso che lo standard codifica soltanto una minima parte di tutte le famiglie linguistiche adoperate dalla linguistica, va precisato che il documento presuppone le seguenti definizioni:

  • famiglia di linguaggi (language family): "due o più linguaggi a sé stanti aventi un antenato comune";
  • gruppo linguistico (linguistic group): "due o più linguaggi a sé stanti alle quali, in determinate circostanze, è lecito riferirsi come se fossero un'entità unica".

In particolare, secondo l'ISO 639-5 gli appartenenti a un gruppo linguistico non devono essere necessariamente linguisticamente correlati. Con l'espressione "in determinate circostanze" si intende che i due linguaggi possono esser caratterizzati da vicinanza geografica, affinità di utilizzo, o venire raggruppati seguendo categorie e criteri che prescindono da quelli strettamente linguistici.

Lo standard è stato pubblicato nel 2008. Per un tentativo di codificare le famiglie linguistiche in maniera più esaustiva, si può vedere lo standard ISO 639-6.

ISO 639-6[modifica | modifica wikitesto]

  • ISO 639-6:2009: Codici per la rappresentazione dei nomi delle lingue -- Parte 6: Alpha-4 code. Per una codifica generale delle varianti linguistiche

L'ISO 639-6 utilizzava codici identificativi di 4 lettere (alpha-4) e nomi specifici per costruire un indice generale delle famiglie linguistiche, dei singoli linguaggi e delle singole varianti linguistiche riconosciute all'interno di ciascun linguaggio identificato, siano esse linguaggi viventi, estinti o artificiali. Lo standard includeva anche i gruppi linguistici, secondo la stessa definizione che ne era stata data nell'ISO 639-5.

La grande novità dello standard ISO 639-6 stava nell'esser stato progettato avendo in mente l'inserimento delle cosiddette varietà linguistiche: l'indice era stato progettato per codificare tutte le varianti linguistiche attualmente conosciute, e per garantire spazio sufficiente a future espansioni e nuovi inserimenti. Il codice avrebbe dovuto assicurare la compatibilità "all'indietro" con i codici ISO 639 precedentemente già pubblicati.

Lo standard è stato pubblicato nel 2009, ma è stato ritirato nel 2014. Allo stato attuale, pertanto, il tentativo più generale di attribuire codici identificativi alle lingue conosciute rimane l'ISO 639-3.

Note[modifica | modifica wikitesto]

  1. ^ report del sito Ethnologue per il codice ISO 639 "zho" Archiviato il 12 settembre 2014 in Internet Archive. su ethnologue.com
  2. ^ ISO639-3 su SIL.org

Voci correlate[modifica | modifica wikitesto]

Altri progetti[modifica | modifica wikitesto]

Collegamenti esterni[modifica | modifica wikitesto]

Linguistica Portale Linguistica: accedi alle voci di Wikipedia che trattano di linguistica