Computador, corpus e concordância no ensino da léxico-gramática de língua estrangeira

Por Tony Berber Sardinha (LAEL & Depto. de Linguística, PUC/SP)

1. Introdução

Uma das mudanças mais sensíveis ocorridas na sociedade nas últimas duas décadas foi a popularização do computador, notadamente o micro-computador. Hoje o computador está presente nas mais variadas áreas da vida humana, até mesmo nas esferas da vida cotidiana. No ensino de língua estrangeira não poderia ser diferente. Há vários software para uso na sala-de-aula bem como programas e websites para auto-aprendizado (cf. Egbert & Hanson-Smith, 1999). Esta é, digamos, a faceta mais visível deste processo. Há, contudo, uma outra ‘revolução silenciosa’, acontecendo nos bastidores, que envolve uma mudança progressiva do nosso entendimento de questões-chave acerca do funcionamento, comportamento, descrição e ensino do léxico, motivada em larga medida pelo emprego maior do computador no ensino e pesquisa. As mudanças levadas a cabo por esta revolução estão intimamente ligadas à maior disponibilidade de corpora computadorizados, isto é, coletâneas de texto escrito ou falado armazenadas em computador. Muitos materiais de ensino e referência que hoje chegam às mãos dos professores de língua são produtos desta revolução (cf. Biber, Johansson, Leech, Conrad, & Finegan, 1999; Sinclair et al., 1995). É sobre estas mudanças que este capítulo buscará fazer algumas considerações.

2. Computador, linguística, Linguística de Corpus

O microcomputador é uma ferramenta que pode mudar não somente como pesquisamos a linguagem, mas também como a enxergamos:

“O desenvolvimento do computador com memória poderosa seria para a Lingüística o que o desenvolvimento do microscópio com lentes poderosas foi para a biologia – uma oportunidade não somente de ampliar nosso conhecimento mas de transformá-lo.” (Hoey, 1993; tradução minha.)

O impacto mais notável da adoção dos computadores na pesquisa Lingüística é a quantidade de dados que podemos analisar. Beaugrande (1999, p.244) categoriza a
lingüística tradicional (‘mainstream’) como tendo ‘antipatia a dados’. Phillips (1989) usa uma metáfora para descrever tal antipatia:
“A Lingüística tem tradicionalmente se restringido à investigação de porções de linguagem que podem ser confortavelmente acomodadas no quadro negro comum.” (Phillips, 1989, p.8; tradução minha.)

O computador trouxe a capacidade de armazenar quantidades crescentes de linguagem natural (textos escritos, conversação, etc.), portanto aumentando o campo de visão do linguista acerca da linguagem. A Linguística de Corpus é a área da linguística que se ocupa da coleta e exploração de corpora, ou conjuntos de dados linguísticos textuais, em formato legível por computador, que foram coletados criteriosamente com o propósito de servirem para a pesquisa de uma língua ou variedade linguística. Como tal, dedica-se à exploração da linguagem através de evidências empíricas, extraídas por meio de computador. Há uma grande quantidade de corpora eletrônicos em existência atualmente, de várias línguas. Os precursores foram os de inglês, notadamente o corpus Brown, lançado em 1964, com 1 milhão de palavras de inglês americano escrito e seu par britânico, o LOB, de 1978, também com 1 milhão de palavras. Mais recentemente, os corpora cresceram muito em magnitude. O BNC (British National Corpus), por exemplo, lançado em 1995, conta com 100 milhões de palavras (inglês britânico, falado e escrito), e o Bank of English, em constante crescimento, possui atualmente mais de 400 milhões de palavras de inglês (falado e escrito).

A Linguística de Corpus não oferece somente um conjunto de técnicas computadorizadas para verificação de questões tradicionais do léxico, semântica, sintaxe, etc. Pelo contrário:

“A análise de um corpus pode revelar, e frequentemente revela, fatos a respeito de uma língua pelos quais nunca se tinha pensado procurar.” (Kennedy, 1998, p. 9, tradução minha.)

Dessa forma, a Linguística de Corpus apresenta-se como tendo um caráter ao mesmo exploratório e contestatório, definindo:

“… não somente uma nova metodologia emergente para o estudo da linguagem, mas uma nova empreitada de pesquisa, e na verdade uma nova abordagem filosófica.” (Leech, 1992, p.106)

De modo mais amplo, Hoey define a Linguística de Corpus como uma maneira de se chegar à linguagem, afirmando que a “Linguística de Corpus não é um ramo da linguística, mas a rota para a linguística.” (Hoey, 1997, tradução minha).

3. Princípio idiomático: padronização, chunks, fraseologia

Uma área de investigação linguística que emprega computadores e corpora é a investigação da padronização do léxico, ou léxico-gramática (e.g. Francis & Hunston, 1996, 1998; Hunston & Francis, 2000; Partington, 1998; Sinclair, 1991; Stubbs, 1996). De modo geral, a padronização é a regularidade expressa na recorrência sistemática de unidades coocorrentes de várias ordens (lexical, gramatical, sintática, etc.). Como definem Hunston e Francis (2000, p.37):

“The patterns of a word can be defined as all the words and structures which are regularly associated with the word and which contribute to its meaning. A pattern can be identified if a combination of words occurs relatively frequently, if it is dependent on a particular word choice, and if there is a clear meaning associated with it.”

Pode-se distinguir três tipos de padrões léxico-gramaticais:

(1) Colocação: associação entre itens lexicais. Por exemplo, ‘stark’ se associa a ‘contrast’, e ‘sheer’ a ‘scale’, ‘number’, e ‘force’ (Partington, 1998). É o tipo de padrão mais
comumente enfocado na Linguística de Corpus. Foi originalmente introduzido por Firth (1957) e é explicado por sua famosa frase: ‘you shall judge a word by the company it keeps’.

(2) Coligação: associação entre itens lexicais e gramaticais. Por exemplo, ‘start’ é mais comum com sintagmas nominais e orações –ing, enquanto ‘begin’ é mais usado com
um complemento ‘to’(Biber, Conrad, & Reppen, 1998).

(3) Prosódia semântica: associação entre itens lexicais e conotação (negativa, positiva ou neutra) de campos semânticos. O nome se deve ao fato de certas palavras prepararem o ouvinte ou o leitor para o conteúdo semântico que está por vir, da mesma maneira que a prosódia na fala indica para o interlocutor que tipos de sons virão a seguir (Hoey, 1997, p.4). Por exemplo, ‘cause’ tem uma prosódia semântica negativa, pois se associa a palavras desfavoráveis como ‘problem(s)’, ‘damage’, ‘death(s)’, ‘disease’, ‘concern’, e ‘cancer’. Já ‘provide’ possui uma prosódia semântica positiva ou neutra, já que se associa a palavras deste tipo, tais como ‘assistance’, ‘care’, ‘jobs’,
‘opportunities’, e ‘training’ (Stubbs, 1995).

Um termo geral que abarca os três tipos de padrão acima é ‘chunk’ (porções). Este termo é normalmente empregado em trabalhos voltados ao ensino de línguas (Lewis, 1993, 1997; Lewis, McCarthy, & Schmitt, 1996). Os vários tipos de padrão estão interligados, e essa interligação é particularmente importante para o ensino de línguas estrangeiras, visto que para o aluno é importante saber como os vários ângulos de descrição da léxico-gramática estão interligados (Hoey, 2000).

O estudo da padronização encontra amparo teórico na noção do princípio idiomático (idiom principle), segundo o qual o usuário de uma língua tem à sua disposição “um grande número de frases pré- ou semi-construídas que se constituem em escolhas únicas, muito embora pareçam analisáveis em segmentos” (Sinclair, 1987, p. 320, tradução minha). Deste modo, há um espaço comum formado pelo léxico e pela sintaxe, a léxico-gramática, no qual ambos são co-selecionados: a escolha de cada item lexical implica na redução das escolhas dos itens lexicais e das categorias gramaticais que podem segui-lo. A escolha de uma classe gramatical reduz a escolha possível de classes gramaticais e itens lexicais que podem seguir-se a ela. A pesquisa em Linguística de Corpus descreve com precisão as probabilidades de certos itens ocorrerem em co-textos específicos, e desse modo a separação entre os níveis do léxico e da gramática torna-se desnecessária, sendo uma questão de conveniência analítica, sem respaldo empírico (Sinclair, 1991). Kennedy (1991, p.98) chama de ‘ecologia linguística’ o estudo de padrões léxico-gramaticais, pois o que está sendo investigado é o comportamento de itens lexicais ou estruturas gramaticais no seu ‘habitat’ natural (o meio linguístico que ocorrem).

A padronização também é um tema de pesquisa na área conhecida como Fraseologia. A área da fraseologia é ampla, englobando, segundo Cowie (1998b), tanto os estudos
descritivos baseados em corpora de inspiração neo-Firthiana (Moon, 1998), quanto os de natureza pedagógica (Howarth, 1998), passando pelos de cunho mais teórico e taxonômico (e.g. Mel’cuk, 1998; Teliya, Bragina, Oparina, & Sandomirskaya, 1998). O termo ‘fraseologia’ é inclusive muitas vezes empregado como sinônimo de padrão; assim, é comum encontrar expressões como ‘a fraseologia da palavra x’, referindo-se aos padrões observáveis da palavra em questão.

Em ambas as áreas (Linguística de Corpus ou Fraseologia), a observação de padrões é tida como de suma importância no ensino de língua estrangeira, pois a sensação de
‘naturalidade’ na fala ou na escrita depende em grande parte do emprego de padrões, conforme coloca Fox (1998b, p.33):

“When even very good learners of the language speak of write English, the effect is slightly odd. There is nothing that is obviously wrong, but somehow native speakers know that they would not express themselves in quite that way. The problem is often one of collocation – the words which are frequently used together.”

4. Mitologia no ensino de línguas

A descrição da linguagem empreendida pela Linguística de Corpus frequentemente expõe algumas das ‘verdades’ aceitas e difundidas nos livros didáticos e de referência como ‘mitos’. Isso acontece normalmente porque:

“Metodologias de ensino de inglês dão muito pouca importância ao estado da arte da descrição de linguagem, comportando-se como se não houvesse mais dúvida sobre quais seriam os fatos relativos à estrutura do inglês. Em termos práticos isto ocasionou o crescimento e manutenção de uma mitologia acerca do inglês […] que os professores aceitam como verdade, mas que é desafiada pelas evidências provenientes do corpus.” (Sinclair, 1997, p.30)

Tal mitologia incluiria, entre outras coisas, a crença de que:

  • Há dois níveis independentes de organização da linguagem, a sintaxe e o léxico, e que, portanto, se justifica o ensino de línguas através de currículos e abordagens firmadas na separação entre ‘gramática’ e ‘vocabulário’.
  • A sintaxe tem precedência sobre o léxico, isto é, o vocabulário é subserviente à sintaxe, servindo como ‘preenchimento’ de ‘lacunas’ sintáticas.
  • A fluência nativa ou quase-nativa é algo subjetivo que reside na mente dos falantes nativos e que, portanto, não pode ser observada, retratada, e descrita objetivamente.
  • A frequência dos traços linguísticos enquanto reveladora da padronização e convencionalidade do uso da língua é irrelevante porque o mais importante da
    linguagem é seu caráter criativo, e portanto os alunos não precisam aprender sobre modos típicos de expressão em contextos específicos.

A posição que emerge da descrição da linguagem baseada em corpus em face a esta mitologia seria, em linhas amplas, a seguinte:

  • (a) A linguagem não é estruturada pelo princípio de ‘lacuna e preenchimento’ (slot and filler) (Lewis, 2000b; Sinclair, 1991).
  • (b) A linguagem é padronizada (‘patterned’), isto é, traços linguísticos não co-ocorrem aleatoriamente, mas sim de modo estatisticamente significante (Biber, Conrad, & Reppen, 1998; Sinclair, 1991).
  • (c) A sensação de naturalidade e fluência nativa não são aspectos abstratos, mas possuem correlatos linguísticos demonstráveis por meio de padrões (Cowie, 1998a, p.1). Os traços linguísticos em geral, e o léxico em particular, criam ‘relações de expectativa’ (expectancy relations; Eggins, 1994), e é justamente a manutenção destas relações, pelos usuários da língua, que transmite ao ouvinte ou leitor a sensação de naturalidade e fluência (Pawley & Syder, 1983; Sinclair, 1988).
  • (d) A diferença entre sintaxe e léxico é mais uma conveniência metodológica do que uma realidade observável, já que não se precisa destas categorias a priori para se dar conta dos padrões linguísticos de modo exaustivo (Sinclair, 1991).
  • (e) A frequência dos traços linguísticos é pertinente para uma teoria da linguagem, já que:
  • as possibilidades estruturais não se realizam todas (i.e. nem tudo que é possível estruturalmente ocorre de fato), e as frequências dos traços ocorrentes variam sistematicamente (i.e. as diferenças de ocorrência se relacionam não aleatoriamente com contextos específicos). (de Beaugrande, 1999; Halliday, 1991, 1992)

A conseqüência mais direta para o ensino de línguas da confrontação destes mitos é a negação da separação entre léxico e sintaxe, ou seja, da existência de um nível do sistema linguístico que engloba o vocabulário e a gramática, conhecido por léxico-gramática. Para a Linguística de Corpus, a separação destes dois níveis é um artifício metodológico assumido pelas gramáticas de referência que foi depois repassado para as gramáticas pedagógicas e os materiais de ensino. A posição a favor desta separação fica clara no trecho abaixo, retirado de um livro sobre metodologia de ensino do inglês do auge do estruturalismo:

“Nossa abordagem relativa ao ensino de línguas, então, é estrutural. As palavras que escolhemos apresentar para serem usadas nas estruturas são de importância secundária, porque, assim que os padrões do inglês tenham sido dominados, torna-se relativamente fácil aprender novas palavras para encaixar nestes padrões.” (Broughton, 1968, p.14, tradução minha).

A visão mais recente da metodologia de ensino ainda não mudou muito, como demonstra esta passagem de uma outra obra voltada para o ensino de segunda língua:

“A gramática fornece os padrões gerais, e o vocabulário providencia o material para colocar nestes padrões.” (Cook, 1991, p.37, tradução minha.)

Já a posição assumida na Linguística de Corpus é diferente, e sua implementação na sala-de-aula pode ser resumida assim:

“Não devemos sobrecarregar os alunos com vastas quantidades de informação sintática [‘gramática’] de um lado e informação lexical (‘vocabulário’) de outro, as quais eles terão de juntar de acordo com princípios que não estão naturalmente disponíveis para eles na condição de falantes não-nativos. Ao invés disto, as professoras devem apresentar, ao mesmo tempo, as estruturas e o léxico correspondente, seja na forma de listas ou por meio de concordâncias, caso a situação de ensino assim o permita.” (Francis & Sinclair, 1994, p. 200, tradução minha.)

A quantidade de achados de pesquisa relativos à descrição da linguagem nativa é enorme, não sendo possível incluí-los todos aqui. Um pequeno elenco de pontos relacionados ao léxico já contemplados na literatura inclui os seguintes tópicos:

· Like [to infintivo]/[-ing]. Segundo a gramática, a regra seria que ‘like to + infinitivo’ é sempre usado com modais, enquanto ‘like + -ing’ não o é. Segundo o corpus
COBUILD, todavia, ‘like’ também é usado com ‘to’ sem modais, especialmente quando a complementação é mais específica (‘the British like to use liquid cleansers so long as the containers are familiar’). Estes usos não são explicáveis por outras regras difundidas nos livros didáticos que fazem a distinção entre previsão futura (que seria formada por ‘to’) e declaração geral ou presente (que exigiria ‘ing’). Lott conclui que o melhor conselho a dar aos alunos é que podem usar ‘to’ ou ‘ing’ com ‘like’ sem modalização, prestando atenção à especificidade da complementação (Lott, 1995).

· Nice. Este item é tido como ‘o mais neutro dos adjetivos’, mas nem por isso deixa de demonstrar restrições selecionais. ‘Nice’ tipicamente aparece precedido do artigo
indefinido (‘a nice…’), evitando fortemente o definido (‘the nice’). Também demonstra padronização em relação a sua posição na oração. Quando empregado atributivamente, é comumente seguido de outro adjetivo ou gerúndio qualificador (‘a nice relaxing time’). Já quando aparece em posição predicativa, é geralmente precedido por um intensificador (‘an extremely nice girl’) (Sinclair, 1997, p.33).

· Glad. Este outro adjetivo também demonstra restrições selecionais, aparecendo tipicamente em posição predicativa. Além disso, é em geral seguido da razão pela qual
se está contente, comumente através de ‘about’, ‘to’, e ‘that’. A falta da complementação relativa à razão indicaria um emprego marcado deste adjetivo (Sinclair, 1997, p.33).

· Good. Este é um adjetivo polissêmico por excelência. No corpus London-Lund é possível distinguir mais de vinte sentidos, incluindo agradável (‘good film’), afável
(‘good mood’), adequado (‘good fit’), grande (‘good crowd’), entre outros (Kennedy, 1998, pp.91-92). Estes vários sentidos assumem padrões distintos, com fraseologias
específicas. Contudo, falantes não nativos normalmente desconhecem tais padrões (Berber Sardinha, 1999b).

· Borrow. Este verbo demonstra uma tendência de não ser empregado sozinho, preferindo ser acompanhada por modais (can, shall, must, etc; Sinclair, 1997, p.32).

· Big, large, great. Estes três adjetivos são ensinados em geral como sendo sinônimos, mas cada um demonstra preferencias selecionais. ‘Big’ é mais usado para exprimir o sentido de ‘tamanho grande’ (‘big man’); ‘large’ é empregado mais comumente para expressar quantidades (‘large numbers’), e ‘great’ é usado para denotar uma variedade maior de sentidos, incluindo intensidade (‘great big’) e parentesco (‘great aunt’) (Biber, Conrad, & Reppen, 1998).

· Small, little. Assim como os anteriores, estes dois adjetivos não são de fato sinônimos, pois são empregados em contextos diferentes. O emprego mais comuns de ‘little’ é para significar tamanho de algo concreto (‘little boy’), enquanto ‘small’ é usado mais tipicamente para qualificar uma quantidade, aparecendo junto a ‘amount’, ‘number’, e ‘quantity/ies’ (Biber, Conrad, & Reppen, 1998)

· Begin, start. Estes dois verbos também são em geral ensinados como sinônimos, pois possuem valência (potencial de combinação com outros elementos da oração) e
transitividade semelhantes. Ambos podem ser usados tanto transitiva quanto intransitivamente, e com o mesmo leque de complementos (sintagma nominal, frase
‘ing’, ou frase iniciada por ‘to’). Entretanto, assim como os adjetivos discutidos acima, estes dois verbos formam padrões distintos. ‘Start’ é mais comum com sintagmas
nominais e orações ‘-ing’, e ‘begin’ é mais usado com um complemento ‘to’. Há também uma variação de uso de ‘begin’ relativa ao registro. ‘Begin’ é usado predominante como verbo intransitivo em textos acadêmicos, e com complemento de orações ‘to’ em textos de ficção 43% e 72% respectivamente). Já com ‘start’ esta diferença não existe: ele é empregado mais como verbo intransitivo independentemente do tipo de texto. (Biber, Conrad, & Reppen, 1998)

· Somebody/someone, anybody/anyone. Estas formas de ‘body’ e ‘any’ também não estão em variação livre. As formas com ‘body’ são bem mais típicas da fala, enquanto as formas com ‘one’ predominam na escrita. Esta distinção não é apontada nem mesmo por dicionários como o COBUILD, criado a partir da descrição de um corpus representativo (Biber, Conrad, & Reppen, 1998).

Infelizmente, poucos destes pontos são contemplados nos livros didáticos e dicionários para aprendizes de língua estrangeira (Berber Sardinha, 1999c). O ímpeto para a investigação dos traços discutidos acima partiu muitas vezes de interesse descritivo, ou seja, do desejo de se esclarecer pontos obscuros das gramática ou dicionários
da língua nativa. Mas além disso, o desejo de se investigar alguns traços teve sua origem no ensino, isto é, em uma necessidade pedagógica, guiada pelos interesses dos alunos. Há, portanto, uma passagem da exploração (exploration) para o aproveitamento (‘exploitation’) de corpora:

“Whereas, previously, large-scale corpora such as Brown and LOB were used for exploration of linguistic patterns, insights from the exploration of these two corpora
gradually have begun to feed into various aspects of language teaching. Thus, exploitation of corpora is now becoming an increasingly significant additional aspect of corpus work in the sense that learner’s needs are governing decisions about where to undertake descriptive research for various pedagogical purposes.” (Flowerdew, 1998, p.542)
5. Propostas

Duas propostas de ensino de língua estrangeira que exploram e aproveitam corpora na sua fundamentação são o Lexical Approach e o Data Driven Learning.

5.1. Lexical Approach

O ‘Lexical Approach’ foi formulado por Michael Lewis (1993, 1997, 2000a) e sua principal característica é o papel central que o léxico desempenha no conteúdo e na
metodologia. O léxico é descrito por meio de ‘porções’ (chunks) léxico-gramaticais, definidas como ‘itens formulaicos [formulaic] e pré-fabricados’ (Lewis, 1993, p.121). Essas ‘porções’ são realizadas frequentemente como ‘colocações’ ou ‘polipalavras’ (‘polywords’) e são ensinadas através de textos (escritos ou falados). Os alunos são encorajados a manter ‘cadernos lexicais’ onde registram os itens lexicais (em ‘chunks’) com os quais travam conhecimento. É através dos textos que os alunos entram em contato com as porções lexicais e é por meio deles também que os alunos se conscientizam da presença marcante destas unidades na comunicação escrita e falada. As principais ações didáticas envolvidas no ensino segundo o Lexical Approach são as seguintes:

  • Priorização do ensino de colocações, ao se destruir a falsa dicotomia entre léxico e
    gramática.
  • Tratamento de palavras gramaticais como itens lexicais (e.g. ‘would’ não seria visto como um auxiliar do condicional somente, mas essencialmente como um item lexical independente). (A partir de Lewis, 1993, pp. 110-111)

Hill, Lewis e Lewis (2000) resumem essa abordagem perante o aluno e a linguagem, afirmando que o Lexical Approach:

“enfatiza a importância de tornar os alunos conscientes da natureza fraseológica [‘phrasal’] da linguagem. O tipo de multipalavra mais importante é a colocação. (…) A contribuição mais importante que o professor pode fazer para certificar-se de que o ‘input’ torne-se ‘intake’ é ter certeza de que os alunos percebam as colocações e outras expressões [‘phrases’] da língua de input.” (p.116; tradução minha; ênfase no original.)

Os principais tipos de exercícios utilizados nessa abordagem são os seguintes:

(1) Identificar porções lexicais no texto.
(2) Comparar (‘match’) itens.
(3) Completar lacunas (‘gap-filling’).
(4) Extrair colocações de textos.
(5) Localizar erros colocacionais (‘miscollocations’). (Lewis, 1997, pp.89-91)

O Lexical Approach assume uma postura crítica em relação aos currículos nocionais-funcionais e ao comunicativismo com relação a como estas propostas lidaram com o
vocabulário. Tanto o ensino comunicativo de línguas quanto o currículo nocional-funcional de Wilkins fundamenta-se na itemização da linguagem a partir de um conjunto de rótulos de atos de fala, como por exemplo ‘agradecer’ e ‘oferecer ajuda’. Segundo Lewis (1997), esta proposta relega o léxico a um segundo plano, pois subordina-o às funções. Em outras palavras, cada função poderia ser realizada léxico-gramaticalmente de vários modos, ou seja, função e léxico eram independentes.

5.2. Data Driven Learning

Outra proposta que enfatiza o ensino do léxico é o Data Driven Learning, ou DDL, desenvolvida por Tim Johns (Johns, 1994; Johns & King, 1991). Originalmente, ela foi
criada para ensinar gramática do inglês, mas suas aplicações têm se expandido para outras áreas (e.g. Granger & Tribble, 1998) e para outras línguas (Berber Sardinha, 1999a; Jacobi, 2000). A ênfase desta proposta é desenvolver no aluno a habilidade de descoberta (discovery learning), e o papel do professor é o de propiciar meios para que os alunos adquiram estratégias de descoberta. Há, portanto, uma ênfase na conscientização do aluno para o que ele pode descobrir sozinho observando a linguagem autêntica, e o professor, neste contexto, é um orientador ou guia de aprendizagem. O principal instrumento que possibilita a descoberta do aluno é a concordância, produzida por computador. O computador entra como elemento central da aprendizagem, no papel de informante, e não de substituto do professor. A razão do nome DDL é explicado assim:

“O aprendiz de língua é também, essencialmente, um pesquisador cujo aprendizado é movido [driven] pelo acesso a dados linguísticos – daí o uso do termo ‘Data Driven
Learning’ para descrever esta abordagem.” (Johns, 1991b, p.2, tradução minha).

Fica claro que a ênfase desta abordagem é tornar o aluno um pesquisador:

“A pesquisa é uma ferramenta valiosa demais para ficar nas mãos dos pesquisadores.” (Johns, 1991a).

A base da proposta é permitir que os alunos busquem suas próprias respostas trabalhando com o computador, ou com concordâncias impressas preparadas no computador pelo professor. O computador torna-se um provedor de respostas na forma de exemplos em quantidade extraídos de um corpus. O DDL é uma abordagem de cunho essencialmente indutivo, ou seja, os alunos produzem conhecimento de modo ascendente (bottom-up) a partir da observação das concordâncias. Na prática, os alunos trabalham seguindo três princípios indutivos: (a) identificação, (b) classificação, e (c) generalização.

No primeiro momento, os alunos identificam padrões ou aspectos recorrentes na concordância; a seguir, interpretam-nos e os classificam de acordo com critérios próprios; finalmente, fazem generalizações a respeito da ocorrência da classificação em outros conceitos. O ciclo não se encerra necessariamente aí. O aluno pode
partir da generalização já formulada para a investigação de mais dados diferentes, reiniciando assim o ciclo.

O impacto da DDL se faz sentir em relação ao aluno, professor, e ao ensino em si. Isto se dá nestes três elementos-chave da seguinte maneira:

(1) Aluno: Assume um papel mais central e independente, tornando-se um pesquisador dotado de habilidades que lhe permitem obter respostas para suas dúvidas e verificação de suas hipóteses.

(2) Professor: Deixa de ser a fonte única de informação na sala-de-aula. Por conseguinte, diminui a pressão sobre ele para saber todas as respostas. O computador, enquanto informante, assume um papel de destaque como provedor de informação.

(3) Ensino: Centra-se mais no aluno e permite que se fundamente pelo princípio de descoberta. Deixa, portanto, de ser baseado na transmissão de regras prontas.

Há vários exemplos de atividades baseadas na abordagem DDL na literatura (Granger & Tribble, 1998; Hadley, in press; Johns & King, 1991; Ka-cheung, 1994; Milton, 1998). Além disso, há recursos para DDL disponíveis na Internet. A ‘DDL Virtual Library’ (http://sun1.bham.ac.uk /johnstf/ timconc.htm) é uma ótima fonte de atividades prontas para o ensino de várias aspectos da gramática do inglês, as quais servem também de modelo para confecção de tarefas diferentes com outros corpora.

Há três diferenças principais entre o Lexical Approach e o Data Driven Learning. A primeira refere-se ao papel do aluno e do professor. O Lexical Approach é uma abordagem centrada no professor, enquanto o DDL enfatiza o centramento no aluno. A segunda diferença concerne o tipo de atividade utilizado. No DDL, todas as atividades baseiam-se de algum modo em concordâncias produzidas por computador. No Lexical Approach, as atividades são mais variadas, incluindo, além de concordâncias, a manutenção de um caderno de colocações, exercícios de preenchimento de lacunas, seleção e ‘matching’, localização de colocações em textos, além de outros voltados ao emprego de dicionários de colocação. A terceira diferença refere-se ao uso de um corpus eletrônico. No DDL, o corpus ocupa papel central, podendo ser explorado tanto pelo professor quanto pelo próprio aluno (se houver infraestrutura). No Lexical Approach, o corpus é frequentemente empregado, mas muitas atividades não são desenvolvidas a partir dele.

6. Concordâncias

Conforme mencionado acima, um instrumento típico da Linguística de Corpus que é muito empregado no Lexical Approach, no Data Driven Learning e em outras abordagens (Tribble & Jones, 1990) é a concordância, a qual consiste numa listagem dos co-textos (palavras ao redor) nos quais um dado item (palavra isolada, composta, estrutura, etc.) ocorre. O item no qual o usuário está interessado é conhecido por nódulo, palavra-nódulo ou nó (‘node’ ou ‘node word’), palavra de busca (‘search word’), ou palavra-chave (‘key word’). Os tipos de concordância mais comuns são KWIC (‘Key Word In Context’) e KWOC (‘Key Word Out of Context’). A concordância KWIC é a mais convencional e mostra a palavra de busca no centro da listagem ladeada pelas palavras que ocorreram no texto junto a ela. As concordâncias atualmente são feitas por computador, por meio de programas especializados (concordancers), embora, na ausência de equipamento, é possível fazer concordâncias à mão, na lousa (Willis, 1998).

Alguns exemplos de concordância são apresentados logo abaixo. A importância da concordância reside no fato de ela colocar diante do aluno uma quantidade grande de material autêntico, retirado de um corpus. O material é disposto de maneira a permitir uma melhor visualização dos padrões da palavra-nódulo. O estudo e observação de padrões como colocação, coligação e prosódia semântica ficam então otimizados.

As concordâncias podem ser usadas de várias maneiras na sala de aula. Por exemplo, como instrumento para o ensino/ descoberta de:

  • Padrões típicos de itens novos e conhecidos (Fox, 1998b; Granger & Tribble, 1998; Jacobi, 2000; Johns & King, 1991).
  • ‘Feedback’ ao aluno para correção da produção do aluno (Woolard, 2000, p.41).
  • Relações lexicais tais como hiponímia/ superordinação, sinonímia e antonímia (Johns, 1998).
  • Desambiguação de itens aparentemente semelhantes ou do mesmo campo semântico (na língua-alvo ou na língua materna dos alunos) (Partington, 1998).
  • Conotações ou usos metafóricos de itens lexicais (Hoey, 2000; Louw, 1993; Partington, 1998).
  • Sentidos diferentes (polissemia) de um mesmo item lexical (Johns, 1991b).
  • Aspectos teóricos acerca da natureza fraseológica do léxico (Hoey, 2000).

Alguns dos empregos possíveis de concordâncias elencados acima são ilustrados a seguir.

(1) Padrões típicos de itens novos e conhecidos.

É possível ensinar o padrão típico de um item como ‘averse’ por meio de uma concordância como a seguir, extraída do corpus Bank of English (Fox, 1998a):

 

[concordance lines]
Segundo a concordância, um padrão típico de ‘averse’ seria ‘be not averse to +ing’. Assim, os alunos ficam sabendo que ‘averse’ não deve ser usado com um substantivo (*averse to cigarettes), o que seria o padrão mais próximo do equivalente em português (‘aversão a fumo/ cigarro’).

(2) Feedback.

Pode-se usar uma concordância para fornecer feedback ao aluno, permitindo que ele mesmo descubra alternativas para corrigir ou melhorar sua produção escrita. Por exemplo, Woolard (2000, p.41) apresenta a sentença abaixo, produzida por um de seus alunos:

“We will have to increase our prices because of the increasing cost of advertising our products.”

Em vez de simplesmente marcar a repetição de ‘increasing’ e oferecer a ‘forma correta’, o
professor pode dar ao aluno uma concordância de ‘cost of’ para que ele mesmo descubra outras alternativas de colocação. Por exemplo, a concordância abaixo foi retirada do BNC:

… she’s not averse to dishing out rough treatment …
… he was not averse to picking up the phone …
… he’s not averse to the idea of studio work …
… she’s not averse to celebrating any victory …
… she was not averse to causing a stir or two …
… they are not averse to helping the process …
… he was not averse to using his reputation for a …
… they were not averse to using heavy-handed methods …
… have always felt averse to taking orders from others …
… how deeply averse to taking risks …
… is strongly averse to taking pills which may prove …
… he was averse to taking painkillers and had …

Observando a concordância, o aluno pode descobrir que ‘high’ e ‘rising’ são alternativas para ‘increasing’ (Woolard, 2000, p.41).

(3) Relações lexicais: superordinação/hiponímia.

Segundo Johns (1998), muitos hipônimos são marcados no texto por meio da expressão ‘such as’. A concordância abaixo pode ajudar o aluno a explorar este fato para aprender os superordinados (‘drugs’ e ‘diseases’, respectivamente) e seus co-hipônimos (‘cannabis’, ‘heroin’, e ‘scurvy’, ‘smallpox’, por exemplo).

(4) Desambiguação de itens aparentemente semelhantes ou do mesmo campo semântico.

for the escalating cost of this form of welfa
fit . The escalating cost of these tax benefits
essable on the extra cost of providing the bene
ese offset the extra cost of using either uncom
nners . Yet the full cost of providing just pip
le to cover the full cost of poll-tax payments
was the even greater cost of any real alternati
e enormously greater cost of shaping it to the
e 1830s . The high cost of transporting goods
performance and high cost of conveyancing work
d both the very high cost of land on Tyneside a
ther places the high cost of foreign imports ,
use of the increased cost of pensions , but now
unt of the increased cost of living , increased
Greece . The overall cost of the project over t
xpense . The overall cost of capital for a firm
ned about the rising cost of the paper which th
The rising cost of holidays in the U
ears with the rising cost of aircraft and dimin
could be the rising cost of holidays in the U
outlawed . The true cost of allowing unfettere
eral public the true cost of medicines .

(a)

lower virulence than vector-borne _____ such as malaria because transmis
no evidence that they can cure _____ such as arthritis and rheumatism
, both directly and in deficiency _____ such as scurvy and beri-beri
le , are suffering an increase in _____ such as typhoid and hepatitis
colds , for wounds , infectious _____ such as typhoid , as a
orbade the admission of infectious _____ such as smallpox . From
He notes that the incidence of _____ such as tuberculosis , cholera ,
It is claimed that psychiatric _____ such as manic depression or s
In his view , directly transmitted _____ such as common colds generally

(b)

for a long period of time and _____ such as cannabis and amphetamines
lactation with humilacting and _____ such as metoclopramide ; support
unemployment and use of illegal _____ such as heroin ( Peck and
cided to exclude users of legal _____ such as alcohol , tobacco and
as well as a variety of other _____ such as cannabis , hallucinogenics
ose that determine addiction to _____ such as heroin and cocaine
usion continues . A few unusual _____ such as digoxin may be secreted
sycho-therapeutic approach with _____ such as methadone and Librium
manipulation of HbF levels with _____ such as 5-azacytidine is currently

As diferenças entre itens tais do mesmo campo semântico como ‘wound’ e ‘injury’ podem ser exploradas por meio de uma concordância tal qual a seguir:

, who suffered appalling brain injuries , was placed on a life
ovember 7 last year from head injuries . After falling and
treated for suspected internal injuries and his passenger for a
were one or two other minor injuries . Four soldiers
ee occupants suffered multiple injuries and were certified dead
cidents involving many serious injuries , that have taken place
to the control of road traffic injuries and of cigarette smokin
ns as well as against external injury. ( p.73 ) This
11 . A persistent knee injury has forced Northants allr
. Until suffering a shoulder injury last season , Dean never
, who has an Achilles tendon injury . Steve Whitton has
in county week due to a wrist injury , is also well-placed aft

suffered a less serious knife wound to his arm , and after
derson fell dying with gunshot wounds , and the Ford Capri car
yer said the leader ‘s gunshot wounds are taking their toll , c
ou that one of the five stab wounds did not kill your friend
n’t get work through their war wounds . They told us it w

Ao identificar os padrões mais típicos de cada item, os alunos podem perceber a diferença de sentido entre os dois itens. Por exemplo, entre outras coisas, a concordância traz evidências de que ‘injury’ é um termo mais geral, pois pode ser ‘internal’ ou ‘external’, enquanto ‘wound’ é usado para ferimentos ‘externos’, causados por objetos ou armas, tais como ‘gunshot wounds’, ‘stab wounds’, etc.

É possível promover variações nos exemplos mostrados acima. Muitas dessas atividades podem ser feitas com o auxílio de um dicionário de colocações (Hill, Lewis, & Lewis, 2000, pp. 110-111). Além disso, as atividades podem ser realizadas com concordâncias impressas em papel ou mostradas na tela do computador.
7. Comentários finais

Este artigo começou tratando de uma revolução silenciosa que se apresenta na forma da maior penetração dos computadores no ensino de língua estrangeira. Aliado à exploração de corpora eletrônicos, os computadores podem alterar como vemos a linguagem e quanto dela podemos ver. O professor de língua estrangeira tem à sua disposição pelo menos duas propostas de ensino e exploração da léxico-gramática por computador (Lexical Approach e Data Driven Learning). O emprego do computador e corpora no ensino não depende da adoção na íntegra de nenhuma proposta fechada. Pelo contrário, o professor pode integrar concordâncias no método ou abordagem que adota. Conforme ilustraram os exemplos mostrados acima, as concordâncias permitem ensinar aspectos importantes da padronização ou fraseologia da léxico-gramática. Além disso, as concordâncias oferecem a possibilidade de os alunos explorarem e descobrirem aspectos da léxico-gramática por si mesmos.

Além de permitir a descoberta e ensino de padrões autênticos atestados em corpora, a exploração da léxico-gramática via concordâncias também justifica-se do ponto de vista psicolinguístico. Conforme argumenta Hoey (2000, p.238):

“As we learn our first language, we build up in our heads a profile of the words we are learning. The so-called Language Acquisition Device in a baby’s head is more likely to be a set of concordancing ‘software’ that enables us to find regularities and recurrent features in our linguistic experience, rather than any abstract grammar-making device.”

Ainda segundo Hoey (2000, p.238), a consequência disso para o ensino é que o aluno deve ser exposto à maior quantidade de linguagem autêntica possível, para que ele possa desenvolver os perfis mentais voltados à percepção e produção dos padrões lexicais associados à língua-alvo. A automatização da seleção destes padrões, na produção e recepção da língua estrangeira, é o que pode vir a permitir a fluência e naturalidade tão comumente associadas à produção de um falante nativo (Pawley & Syder, 1983).

Há várias críticas ao uso de corpora e concordâncias no ensino. Em relação a corpora, Carter et al. (1998) alertam para o fato de que o estatuto de falante nativo é problemático. Desta forma, os professores devem ser críticos em relação à informação retirada de corpora de falantes nativos, pois este tipo de informação pode não ser útil ou relevante, já que em algumas situações de aprendizado, o modelo do ‘falante nativo’ pode não ser o mais adequado.

Uma segunda crítica refere-se à necessidade de separar validade pedagógica de validade descritiva (Aston, 1997). O que as descrições de léxico-gramática baseadas em corpus alegam possuir é validade descritiva, mas não necessariamente validade pedagógica. Ou seja, nem tudo que é relevante num corpus é relevante para o aluno e vice-versa. Esta crítica procede, mas em nenhum momento é dito na literatura que o corpus deva ditar o conteúdo do curso ou das atividade de sala de aula.

Uma terceira crítica diz respeito à possível incompatibilidade entre o uso de concordâncias e o ensino comunicativo de línguas, já que as concordâncias promoveriam a
descontextualização da linguagem por mostrarem apenas pequenos trechos provenientes de várias textos (Aston, 1995). Este problema pode ser evitado fornecendo aos alunos maiores quantidades de texto em cada concordância, ou permitindo aos alunos que tenham acesso a concordanceador que ofereça a visualização dos textos do corpus na íntegra.

Finalmente, outra crítica comum é a preocupação de que o aluno possa ter acesso a informações através do corpus que contradigam o ensinamento passado pelo professor
(Owen, 1996). Há nestes casos o risco de se minar a autoridade do professor na sala-de-aula, pois em comparação com um corpus, o conhecimento intuitivo do professor é visto como insuficiente, principalmente se for não-nativo. Uma maneira de o professor evitar este problema é não assumir a função de detentor do conhecimento e colocar-se no papel de facilitador de pesquisa, permitindo que os alunos descubram informações novas.

Em geral, essas críticas alertam que o computador, corpora e concordâncias não devam ser considerados os únicos instrumentos para o ensino de línguas, mas sim que devam ser usados com consciência de suas vantagens e limitações.

Em conclusão, o computador não é um modismo passageiro e tem todo o potencial para aumentar em muito a visão que o professor de língua estrangeira tem da linguagem. Algumas ferramentas, como a concordância, e recursos, como corpora eletrônicos, colocam à disposição do professor um mundo de informações até então impensado. Usados prudentemente, são instrumentos indispensáveis na aprendizagem de língua estrangeira.

Referências Bibliográficas

Aston, G. (1995). Corpora in language pedagogy: matching theory and practice. In G. Cook & B. Seidlhofer (Orgs.), Principle and Practice in Applied Linguistics – Studies in
Honour of H G Widdowson (pp. 257-270). Oxford: Oxford University Press.

Aston, G. (1997). Enriching the learning environment: Corpora in ELT. In A. Wichmann, S. Fligelstone, T. McEnery, & A. Wilson (Orgs.), Teaching and language corpora (pp. 51-63). London: Longman.

Beaugrande, R. de (1999). Reconnecting real language with real texts: Text Linguistics and Corpus Linguistics. International Journal of Corpus Linguistics, 4(2), 243-260.
Berber Sardinha, A. P. (1999a). Beginning Portuguese Corpus Linguistics: Exploring a corpus to teach Portuguese as a Foreign Language. Delta, 15, 291-302. Disponível em www.scielo.br

Berber Sardinha, A. P. (1999b). Br-ICLE, the Brazilian sub-corpus of the International Corpus of Learner English – A progress report. Trabalho apresentado no Learner
Corpus Workshop. Women’s University, Tokyo, Japan.

Berber Sardinha, A. P. (1999c). Computadores e corpora na produção de dicionários: O que isso tem a ver com o ensino de línguas? Trabalho apresentado no Simpósio ‘O aprendiz de língua inglesa e os dicionários’, ENPULI, 21 de julho de 1999, USP, São Paulo, SP.

Biber, D., Conrad, S., & Reppen, R. (1998). Corpus linguistics – Investigating language structure and use. Cambridge: Cambridge University Press.

Biber, D., Johansson, S., Leech, G., Conrad, S., & Finegan, E. (1999). Longman Grammar of Spoken and Written English. Harlow: Longman.

Broughton, G. (1968). Success with English — Teacher’s Handbook. Penguin: Harmondsworth.

Carter, R., Hughes, R., & McCarthy, M. (1998). Telling tails: Grammar, the spoken language and materials development. In B. Tomlinson (Org.), Materials Development in
Language Teaching (pp. 67-86). Cambridge: Cambridge University Press.

Cook, G. (1991). Second Language Learning and Language Teaching. London: Longman.

Cowie, A. P. (1998a). Introduction. In A. P. Cowie (Org.), Phraseology — Theory, Analysis, and Application (pp. 1-22). Oxford: Clarendon Press.

Cowie, A. P. (Org.). (1998b). Phraseology – Theory, Analysis, and Applications. Oxford: Clarendon.

Egbert, J., & Hanson-Smith, E. (Orgs.). (1999). CALL Environments – Research, Practice, and Critical Issues. Alexandria, Va.: TESOL.

Eggins, S. (1994). An introduction to Systemic Functional Linguistics. London: Pinter.

Firth, J. R. (1957). Papers in Linguistics – 1934-1951. Oxford: Oxford University Press.

Flowerdew, L. (1998). Corpus linguistics techniques applied to textlinguistics. System, 26, 541-552.

Fox, G. (1998a). Hocus pocus and graven images: collocation ’98. Palestra apresentada na conferência IATEFL 98, UMIST, Manchester, UK.

Fox, G. (1998b). Using corpus data in the classroom. In B. Tomlinson (Org.), Materials development in language teaching (pp. 25-43). Cambridge: Cambridge University
Press.

Francis, G., & Hunston, S. (1996). Grammar Patterns 1: Verbs. London: HarperCollins, COBUILD.

Francis, G., & Hunston, S. (1998). Grammar Patterns 2: Nouns and Adjectives. London: HarperCollins, COBUILD.

Francis, G., & Sinclair, J. (1994). ‘I bet he drinks Carling Black Label’: A riposte to Owen on corpus grammar. Applied Linguistics, 15, 190-200.

Granger, S., & Tribble, C. (1998). Learner corpus data in the foreign language classroom: Form-focused instruction and data-driven learning. In S. Granger (Org.), Learner
English on Computer (pp. 199-209). New York: Longman.

Hadley, G. (no prelo). Sensing the winds of change – An introduction to DDL. Online document.

Halliday, M. A. K. (1991). Corpus studies and probabilistic grammar. In K. Aijmer & B. Altenberg (Orgs.), English corpus linguistics: Studies in honour of Jan Svartvik (pp. 30- 43). London: Longman.

Halliday, M. A. K. (1992). Language as system and language as instance: The corpus as a theoretical construct. In J. Svartvik (Org.), Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82, Stockholm, 4-8 August 1991 (pp. 61-78). Berlin, New York: De Gruyter.

Hill, J., Lewis, M., & Lewis, M. (2000). Classroom stragegies, activities and exercises. In M. Lewis (Org.), Teaching Collocation – Further Developments in the Lexical Approach (pp. 88-117). Hove: LTP.

Hoey, M. (Org.). (1993). Data, description, discourse – Papers on the English language in honour of John McH Sinclair on his sixtieth birthday. London: HarperCollins.

Hoey, M. (1997). From concordance to text structure: New uses for computer corpora. In B. Lewandoswka-Tomaszczyk & P. J. Melia (Orgs.), PALC’97 – Pracical Applications in Language Corpora (pp. 2-22). Lodz: Lodz University Press.

Hoey, M. (2000). A world beyond collocation: New perspectives on vocabulary teaching. In M. Lewis (Org.), Teaching Collocation – Further Developments in the Lexical
Approach (pp. 224-243). Hove: LTP.

Howarth, P. (1998). Phraseology and second language proficiency. Applied Linguistics, 19, 24-44.

Hunston, S., & Francis, G. (2000). Pattern Grammar – A corpus-driven approach to the lexical grammar of English. Amsterdam/ Philadelphia: John Benjamins.

Jacobi, C. (2000). Introducing concordances to teach Spanish to Brazilian students.

TALC’2000, Graz, Austria.

Johns, T. (1991a). From printout to handout: Grammar and vocabulary teaching in the context of Data-Driven Learning. ELR Journal, 4, 27-46.

Johns, T. (1991b). Should you be persuaded: two examples of data driven learning. ELR Journal, 4, 1-16.

Johns, T. (1994). From printout to handout: Grammar and vocabulary teaching in the context of Data-driven learning. In T. Odlin (Org.), Perspectives on pedagogical grammar (pp. 293-313). Cambridge: Cambridge University Press.

Johns, T. (1998). Virtual DDL Library. Web site: http://sun1.bham.ac.uk/johnstf/timconc.htm.

Johns, T., & King, P. (Orgs.). (1991). Classroom Concordancing — ELR Journal 4. Birmingham: Centre for English Language Studies, University of Birmingham.

Ka-cheung, B. M. (1994). Learning strategies in ESP classroom concordancing: an initial investigation into data-driven learning. In L. Flowerdew & A. K. K. Tong (Orgs.), Entering Text (pp. 197-214). Hong Kong: Language Centre, The Hong Kong University of Science and Technology.

Kennedy, G. (1991). ‘Between’ and ‘through’: The company they keep and the functions they serve. In K. Aijmer & B. Altenberg (Orgs.), English Corpus Linguistics – Studies in honour of Jan Svartvik (pp. 95-110). London / New York: Longman.

Kennedy, G. (1998). An introduction to Corpus Linguistics. New York: Longman.

Leech, G. (1992). Corpora and theories of linguistic performance. In J. Svartvik (Org.), Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82, Stockholm, 4-8 August 1991 (pp. 105-127). Berlin, New York: De Gruyter.

Lewis, M. (1993). The Lexical Approach – The state of ELT and a way forward. Hove: Language Teaching Publications.

Lewis, M. (1997). Implementing the lexical approach — Putting theory into practice. Hove: LTP.

Lewis, M. (Org.). (2000a). Teaching Collocation: Further Developments in the Lexical Approach. Hove: LTP.

Lewis, M. (2000b). There is nothing as practical as a good theory. In M. Lewis (Org.), Teaching Collocation – Further Developments in the Lexical Approach (pp. 10-27).
Hove: LTP.

Lewis, M., McCarthy, M., & Schmitt, N. (1996). Vocabulary as lexical chunks: Descriptive psycholinguistic and pedagogical perspectives. Colloquium, 30th TESOL Annual
Convention, Chicago, Ill, USA, 27 March 1996.

Lott, B. (1995). News from the corpus – like to do / like doing. Modern English Teacher, 4, 19-20.

Louw, B. (1993). Irony in the text or insincerity in the writer: the diagnostic potential of semantic prosodies. In M. Baker, G. Francis, & E. Tognini-Bonelli (Orgs.), Text and
technology – Essays in honor of John McH Sinclair. Amsterdam/Atlanta,GA: John Benjamins.

Mel’cuk, I. (1998). Collocations and lexical functions. In A. P. Cowie (Org.), Phraseology — Theory, Analysis, and Application (pp. 23-54). Oxford: Clarendon Press.

Milton, J. (1998). Learner corpus data in the foreign language classroom: Form-focused instruction and data-driven learning. In S. Granger (Org.), Learner English on
Computer (pp. 199-209). New York: Longman.

Moon, R. (1998). Fixed Expressions and Idioms in English – A Corpus-Based Approach. Oxford: Clarendon Press.

Owen, C. (1996). Do concordances require to be consulted? ELT Journal, 50, 219-224. Partington, A. (1998). Studies in Corpus Linguistics 2. Patterns and Meanings – Using Corpora for English Language Research and Teaching. Amsterdam/Philadelphia: John Benjamins.

Pawley, A., & Syder, H. (1983). Two puzzles for linguistic theory: Native-like selection and native-like fluency. In J. Richards & R. Schmidt (Orgs.), Language and Communication (pp. 191-226). London: Longman

Phillips, M. (1989). Discourse analysis monographs: 12. Lexical Structure of Text. Birmingham: ELR, University of Birmingham.

Sinclair, J. McH. (1987). Collocation: a progress report. In R. Steele & T. Threadgold (Orgs.), Language topics – Essays in honour of Michael Halliday (Vol. 2, pp. 319-332).
Amsterdam/Philadelphia: John Benjamins.

Sinclair, J. McH. (1988). Naturalness in language. ELR Journal, 2, 11-20.

Sinclair, J. McH. (1991). Corpus, Concordance, Collocation. Oxford: Oxford University Press.

Sinclair, J. McH. (1997). Corpus evidence in language description. In A. Wichmann, S. Fligelstone, T. McEnery, & G. Knowles (Orgs.), Teaching and language corpora (pp.
27-39). London and New York: Longman.

Sinclair, J. McH. et al. (1995). COBUILD English Dictionary (New ed.). London: Collins COBUILD.

Stubbs, M. (1995). Corpus evidence for norms of lexical collocation. In G. Cook & B. Seidlhofer (Orgs.), Principle and Practice in Applied Linguistics- Studies in Honour of
H G Widdowson (pp. 245-256). Oxford University Press: Oxford.

Stubbs, M. (1996). Text and Corpus Analysis — Computer-Assisted Studies of Language and Culture. Oxford: Blackwell.

Teliya, V., Bragina, N., Oparina, E., & Sandomirskaya, I. (1998). Phraseology as a language of culture: Its role in the represenation of a cultural mentality. In A. P. Cowie (Org.), Phraseology — Theory, Analysis, and Application (pp. 55-78). Oxford: Clarendon Press.

Tribble, C., & Jones, G. (1990). Concordances in the classroom – A resource book for teachers. London: Longman.

Willis, J. (1998). Concordances in the classroom without a computer: Assembling and exploiting concordances of common words. In B. Tomlinson (Org.), Materials
development in language teaching (pp. 44-66). Cambridge: Cambridge University Press.

Woolard, G. (2000). Collocation – Encouraging learner independence. In M. Lewis (Org.), Teaching Collocation – Further Developments in the Lexical Approach (pp. 28-46). Hove: LTP.

 

Compartilhe...Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedIn