quinta-feira, 19 de novembro de 2009

Português: a segunda língua do Twitter


Recentemente o site Web Ecology Project lançou um código em Python para detecção da língua usada em sites (confira aqui). Para demonstrar o funcionamento do código, eles o aplicaram para detectar a língua usada em uma amostra de 1 milhão de tweets. Os resultados estão no gráfico ao lado (clique na imagem para ampliar). O português foi a segunda língua mais usada para tuitar, seguido de longe pelo japonês e espanhol! Mesmo assim, as opções de linguas no Twitter são o inglês, italiano, espanhol, francês, alemão e japonês.
O escritor e ranzinza português, José Saramago, disse que "[o]s tais 140 caracteres refletem nossa tendência para o monossílabo como forma de comunicação. De degrau em degrau, vamos descendo até o grunhido" (Revista Língua Portuguesa, outubro 2009). Ciente da minha pequenez, discordo dele: não é o Twitter ou coisa parecida que está matando a nossa língua. Fosse assim teríamos que criticar os processadores de texto, com seus corretores automáticos até a velha Olivetti com a tecla "corrigir". É a ignorância que nos levará ao grunhido. Grrr...