Papers by Guilherme Fromm
Trabalhos em Linguística Aplicada, 2024
This paper aims to demonstrate the productivity of using Voyant Tools (SINCLAIR; ROCKWELL, c2023)... more This paper aims to demonstrate the productivity of using Voyant Tools (SINCLAIR; ROCKWELL, c2023)-a web environment for text analysis-for pedagogical purposes, especially in (future) lexical researchers training. To do so, we propose discussion rounds and practical activities which can be adapted to different target audiences, from basic education to graduate students. We hope this paper encourages new pedagogical uses of Voyant Tools and also guides teachers who want to introduce students to descriptive linguistic research or to use Voyant Tools as one of their pedagogical resources in classroom.
ALFA: Revista de Linguística, 2024
Objetivamos refletir sobre a terminologia da Linguística analisada pela metodologia da Linguístic... more Objetivamos refletir sobre a terminologia da Linguística analisada pela metodologia da Linguística de Corpus como pesquisa quantitativa e qualitativa. Para tanto, apresentamos, em parte, a construção do vocabulário bilíngue (português e inglês) da Linguística, baseado em corpus, denominado VoBLing, destinado a alunos iniciantes em Letras. Primeiramente, abordaremos a compilação desse corpus comparável, composto por 47 subáreas da Linguística. O registro pretendido foi acadêmico, a partir do qual descrevemos parte da terminologia da Linguística por meio de traços distintivos extraídos de linhas de concordância. As definições são construídas com base na definição terminológica e na definição enciclopédica previamente selecionadas pelo público-alvo. Em segundo lugar, essas funcionalidades foram organizadas em fichas terminológicas on-line do VoTec (Fromm, 2007), uma plataforma on-line bilíngue de gerenciamento terminológico. Portanto, este vocabulário on-line tem um enfoque terminológico e pedagógico, empregando uma abordagem multimodal, para introduzir conceitos linguísticos para alunos iniciantes em línguas. Os usuários têm acesso a definições e a diversos recursos pedagógicos que lhes permitem compreender os conceitos da Linguística e suas subáreas, o que a torna uma plataforma multimodal com potencial para mostrar a definição do termo em questão por meio da semiótica múltipla.
ALFA: Revista de Linguística, 2024
We aim to reflect on the terminology of Linguistics analyzed by Corpus
Linguistics methodology as... more We aim to reflect on the terminology of Linguistics analyzed by Corpus
Linguistics methodology as a quantitative and qualitative research. To do so, we partly present the construction of the corpus-based bilingual vocabulary (Portuguese and English) of Linguistics, called VoBLing, designed for beginner languages students. First, we will address the compilation of this comparable corpus, composed of 47 subareas of Linguistics. The register aimed was academic, from which we describe part of the terminology of Linguistics through distinctive features extracted from concordance lines. Definitions are constructed based on the terminological definition and the encyclopedic definition previously selected by the target audience. Secondly, these features were organized in online terminology card files of VoTec (Fromm, 2007), an online bilingual terminology management platform. Therefore, this online vocabulary has both a terminological and a pedagogical focus, employing a multimodal
approach, to introduce linguistic concepts to beginner language students. The users have access to definitions and to several pedagogical resources that allow them to understand the concepts of Linguistics and its disciplines, what makes it a multimodal platform having the potential to
show the definition of the term in question by using multiple semiotics.
Acta Scientiarum, 2024
VoTec (Vocabulário Técnico Online) is a web environment for terminographic management created by ... more VoTec (Vocabulário Técnico Online) is a web environment for terminographic management created by Fromm (2007) with the aim of training undergraduate and graduate students for terminographic and translation practices. Since 2007, it has been used in several research and projects aimed at researchers training and monolingual and bilingual reference works production. This paper aims to present an overview of the projects and research carried out through VoTec between 2007 and 2023, as well as of the updates made on its database and query page. To do so, we describe its initial version (Fromm, 2007), the Terminology in Fiction (Fromm, 2011a) and the Linguistics Vocabulary (Fromm & Yamamoto, 2013) projects, as well as the following terminographic works/proposals:
As ciências do léxico, 2023
Revista de Estudos da Linguagem, 2021
Revista do Sell, 2021
Este trabalho tem o objetivo de mostrar os principais resultados de uma pesquisa lexical sobre no... more Este trabalho tem o objetivo de mostrar os principais resultados de uma pesquisa lexical sobre nomes de operações policiais por meio de um corpus de notícias. O foco do presente estudo é analisar as informações sobre as origens dos nomes das operações apresentadas pelas notícias. Esses dados foram identificados com o auxílio de um software de análise lexical. No corpus, foram identificados 31 nomes de operações inspiradas em nomes de lugares, 28 nomes que remetem a estrangeirismos e 20 nomes que fazem alusão às Mitologias. As análises mostraram que: há operações que recebem o nome do local de onde foram realizadas, especialmente de nomes de bairros, e outras que são nomeadas com topônimos por metáfora; há o uso estrangeirismos da língua inglesa, principalmente nos casos de combate a crimes cibernéticos, e do latim; no caso das mitologias, há a preferência pela mitologia grega e há a relação de metáfora entre o nome e o elemento mitológico. As perspectivas teóricas foram embasadas na...
Revista de Estudos da Linguagem, 2020
The present work consists of the description and comparison of two lexical analysis software, Wor... more The present work consists of the description and comparison of two lexical analysis software, WordSmith Tools (WST) and Sketch Engine (SE). The study corpus selected for the comparative analysis between the programs is called LexTest which is composed of articles, dissertations, reviews and theses about Lexicology. These texts are written in Portuguese, and the corpus has 552,903 tokens. The aspects analyzed in the WST and in the SE are: interface, language settings, corpus upload, number of tokens and types, corpus tagging, word list, keyword list, access to concordance lines, and so on. Based on the comparative analyzes, it was possible to conclude that the WST and the SE are effective in their purpose, because, for example, they process the keywords and allow configuring the language according to the study corpus and calculate the number of tokens; however, depending on the purpose of the research, one of these programs may be more appropriate than the other. The choice of one of them will be responsibility of the researcher, who may consult the comparative table between the WST and the SE, presented at the end of this paper to substantiate his or her preference.
Estudos Linguísticos, 2020
O objetivo deste trabalho é, em primeiro lugar, apresentar o campo da Terminografia Pedagógica, m... more O objetivo deste trabalho é, em primeiro lugar, apresentar o campo da Terminografia Pedagógica, mostrando suas possíveis bases teóricas e metodológicas, a importância da Linguística de Corpus neste tipo de trabalho, além de alguns exemplos de pesquisa advindos de um ambiente de gerenciamento terminográfico e sua respectiva página de visualização. Como resultado, apresento minha proposta para o que considero elementos fundamentais para o desenvolvimento e consecução de uma Terminografia Pedagógica.
Acta Semiótica et Lingvistica
Resumo: Este trabalho pretende contribuir para uma caracterização de aspectos cognitivos, semióti... more Resumo: Este trabalho pretende contribuir para uma caracterização de aspectos cognitivos, semióticos, semânticos e lexicais do discurso literário de fantasia. Examinam-se aspectos da constituição enunciativa e discursiva da comunicação literária, bem como os patamares cognitivo, semiótico e linguístico do texto literário de fantasia. Partimos principalmente de um quadro teórico composto por contribuições dos estudos lexicais e semióticos e da semântica ficcional de mundos possíveis para compreender o funcionamento da semiose da fantasia literária. O estudo evidencia aspectos caracterizadores do universo de discurso literário de fantasia incluindo a imaginação criadora; a serialização como modo de produção discursivo; a heterogeneidade semântico-conceptual do texto de fantasia; a interdiscursividade e intertextualidade com discursos etnoliterários; e a especificidade semântico-conceptual de unidades lexicais em uso nesse universo de discurso.
The aim of this article is to present a research about the bilingual terminological features of a... more The aim of this article is to present a research about the bilingual terminological features of a TV series called House M.D. We start it presenting the general project the research belongs to and continue explaining the role of medical series in the American TV. In the sequence, we present the theoretical characteristics of the research, which are terminology in TV series (FROMM, 2011) and the Communicative Theory of Terminology (from CABRÉ). The methodology used to compile the corpus is from Corpus Linguistics and the program used in the lexical analysis is Wordsmith Tools (SCOTT, 2008). The terminological data bank manager program used was VoTec (FROMM, 2007) and some of the results are presented in this text, while others can be searched online.
Scientia Traductionis, 2012
Based on Corpus Linguistics and on the books “Alice’s Adventures in Wonderland” and “Through the ... more Based on Corpus Linguistics and on the books “Alice’s Adventures in Wonderland” and “Through the Looking Glass and What Alice Found There”, both in Portuguese and in English, this work identifies Lewis Carroll’s specialized vocabulary and neologisms, and also investigates the author’s possible contributions to English language and to Portuguese via translation. To achieve this goal, a contrastive analysis of those books was carried out by using the software WordStmithTools 5.0 and its three tools: Wordlist, Keywords and Concord.
Domínios de Lingu@gem, 2011
O presente artigo pretende demonstrar a criação de corpora técnicos bilíngues (português e inglês... more O presente artigo pretende demonstrar a criação de corpora técnicos bilíngues (português e inglês), com a finalidade de alimentar um banco de dados de caráter terminográfico. Para tanto, foram construídos dois corpora, bilíngues nas áreas de Informática e Linguística, retirados da Internet, com aproximadamente um milhão de palavras cada um. Os corpora resultantes foram usados para levantamento de candidatos a termos nas duas áreas citadas (através do uso do software WordSmith Tools) e forneceram dados para a construção da microestrutura de verbetes técnicos, através de exemplos reais de uso de língua e dados morfo- sintático- semânticos.
Based on Corpus Linguistics and both “Alice’s Adventures in Wonderland” and “Through the Looking-... more Based on Corpus Linguistics and both “Alice’s Adventures in Wonderland” and “Through the Looking-Glass and What Alice Found There” books, this paper aims at,using the software WordmisthTools 5.0 and two of its tools: Wordlist and Keywords, analyzing the issues of translation, lexical density and keyness involved in the English and Portuguese versions of these works.
Revista do SELL, 2011
Resumo: O objetivo desse trabalho, ainda em fase de pesquisa, é mostrar como alunos dos cursos de... more Resumo: O objetivo desse trabalho, ainda em fase de pesquisa, é mostrar como alunos dos cursos de Letras e/ou Tradução podem aprender a trabalhar com Terminologia/Terminografia bilíngue para descrição de língua. Durante o processo de aprendizado do fazer terminográfico, esses alunos, valendo-se da metodologia da Linguística de Corpus, compilam legendas alternativas, disponíveis gratuitamente na Internet. Essas legendas pertencem a seriados televisivos americanos de ficção que trabalham com terminologia de áreas específicas (como pano de fundo); através delas, e usando programas de análise lexical, como o WordSmith Tools, eles aprendem todas as fases para a criação de vocabulários técnicos.
Debate Terminológico, 2011
El presente articulo se propone presentar un proyecto desarrollado para la creacion de una pagina... more El presente articulo se propone presentar un proyecto desarrollado para la creacion de una pagina de consulta y un banco de datos terminografico que pueden utilizarse para el aprendizaje de terminologia y terminografia por parte de estudiantes de traduccion y de otras carreras. El proyecto, denominado VoTec, propone el desarrollo de una pagina, disponible en Internet, que presente terminos equivalentes en portugues e ingles dispuestos de forma contrastiva. Para la creacion de esa pagina, se desarrollo tambien un banco de datos que la alimenta. Basado en los principios de la Linguistica de Corpus, este banco de datos es alimentado unica y exclusivamente con ejemplos extraidos de corpora de especialidad. La comprension de la pagina de Internet y el posterior trabajo con el banco de datos por parte de los alumnos, supervisados por un profesor especialista en el area, los ayuda en el entendimiento de los conceptos basicos de terminologia y terminografia.
Tradterm, 2010
RESUMO: Este texto pretende levantar, de modo sucinto, algumas discussões sobre os aprendizes de ... more RESUMO: Este texto pretende levantar, de modo sucinto, algumas discussões sobre os aprendizes de Tradução e os cursos para eles disponíveis no Brasil e no mundo. O artigo discute, também, questões pertinentes ao aprendizado da tradução, especialmente o aprendizado de Terminologia, bem como o mercado para aqueles que estão começando a vida profissional.
This article presents the bilingual terminography page called VoTec (available on the Internet at... more This article presents the bilingual terminography page called VoTec (available on the Internet at: The differential of the proposal is the possibility to customize its presentation modes on the screen and the ways to search a data bank, previously prepared. Besides these searches connected to the data bank, the VoTec page also presents links to external searches in related pages, such as online dictionaries and encyclopedias. The page works for both translators who search for a detailed search in terminology and translation students, who need to learn how online dictionary tools work.
Papers by Guilherme Fromm
Linguistics methodology as a quantitative and qualitative research. To do so, we partly present the construction of the corpus-based bilingual vocabulary (Portuguese and English) of Linguistics, called VoBLing, designed for beginner languages students. First, we will address the compilation of this comparable corpus, composed of 47 subareas of Linguistics. The register aimed was academic, from which we describe part of the terminology of Linguistics through distinctive features extracted from concordance lines. Definitions are constructed based on the terminological definition and the encyclopedic definition previously selected by the target audience. Secondly, these features were organized in online terminology card files of VoTec (Fromm, 2007), an online bilingual terminology management platform. Therefore, this online vocabulary has both a terminological and a pedagogical focus, employing a multimodal
approach, to introduce linguistic concepts to beginner language students. The users have access to definitions and to several pedagogical resources that allow them to understand the concepts of Linguistics and its disciplines, what makes it a multimodal platform having the potential to
show the definition of the term in question by using multiple semiotics.
Linguistics methodology as a quantitative and qualitative research. To do so, we partly present the construction of the corpus-based bilingual vocabulary (Portuguese and English) of Linguistics, called VoBLing, designed for beginner languages students. First, we will address the compilation of this comparable corpus, composed of 47 subareas of Linguistics. The register aimed was academic, from which we describe part of the terminology of Linguistics through distinctive features extracted from concordance lines. Definitions are constructed based on the terminological definition and the encyclopedic definition previously selected by the target audience. Secondly, these features were organized in online terminology card files of VoTec (Fromm, 2007), an online bilingual terminology management platform. Therefore, this online vocabulary has both a terminological and a pedagogical focus, employing a multimodal
approach, to introduce linguistic concepts to beginner language students. The users have access to definitions and to several pedagogical resources that allow them to understand the concepts of Linguistics and its disciplines, what makes it a multimodal platform having the potential to
show the definition of the term in question by using multiple semiotics.
utiliza de corpora eletrônicos. O WordSmith Tools® 5.0, desenvolvido por Mike Scott, é
um programa constituído por três ferramentas básicas: Concord, KeyWords e Wordlist.
Cada ferramenta desempenha diferentes funções, as quais, em conjunto, fazem deste
programa um dos mais úteis e versáteis para a análise linguística de corpora (BERBER
SARDINHA, 2004). Assim, neste trabalho, pretendemos mostrar como o WordSmith
Tools (SCOTT, 2008) foi utilizado na análise de um corpus paralelo bilíngue de ficção
literária infanto-juvenil. Para isso, descreveremos brevemente a constituição do corpus
de estudo, os princípios que regem o funcionamento do programa, bem como a
função de cada uma das ferramentas, exemplificando-as a partir de evidências retiradas de nosso corpus de estudo. Esse corpus é composto por catorze textos referentes aos originais em inglês, escritos pela britânica J. K. Rowling, e às traduções em português brasileiro, de Lia Wyler, da série Harry Potter. Para tanto, apresentaremos uma análise prévia das listas de palavras, listas de palavras-chave e listas de concordâncias, focando no processo que levou à análise de alguns aspectos do corpus e à descrição de alguns agrupamentos lexicais formados a partir das lexias wand e varinha.
While in other areas the translators look for translations of the terms they are working with and, generally, find them in the dictionaries (specialized or not), in the information technology field this process is not automatic. Many terms are not translated (loans, like an abbreviation), others are adapted (like verbal neologisms, for example) and others present double or triple possibility in the translation act (literal translation, loan or adaptation). The great problem becomes, then, the translation or not of the terms and the recognition, among a lot of possibilities, of the best choice.
To solve the doubts of the translation colleagues, we decided for a critical analysis of the existing materials, although they are not specific for the translation field (it is a corpus based on published works called, incorrectly, IT dictionaries). Later, we propose the development, in all its stages, of a new material that aims a particular professional: an IT glossary specific for translators, in which it will be created the macro and microstructures and the remissive system, based on words taken from a specific IT corpus.