BADIP

BAnca Dati dell'Italiano Parlato

Text Size

Il corpus del Lessico di frequenza dell'italiano parlato (Corpus LIP) è una delle raccolte di testi dell'italiano parlato più importante e più utilizzata nella ricerca linguistica. Fu costituito nel 1990-1992 da un gruppo di linguisti diretto da Tullio De Mauro e servì per costruire, in collaborazione con la Fondazione IBM Italia, il primo lessico di frequenza dell'italiano parlato (cf. De Mauro, Mancini, Vedovelli, Voghera 1993). I suoi 469 testi, contenenti complessivamente ca. 490.000 parole, furono raccolti in quattro città (Milano, Firenze, Roma e Napoli) e provengono da cinque macroclassi e numerose sottoclassi di discorso.

Ringraziamo Tullio De Mauro, Federico Mancini, Massimo Vedovelli, Miriam Voghera, ETAS Libri S. p. A. e la Fondazione IBM Italia per la concessione dei diritti di utilizzo del corpus.