Descrever Palavras

Descrever Palavras

A ideia do motor de Descrever Palavras surgiu quando eu estava a construir o motor para Palavras Relacionadas (é como um thesaurus, mas dá-lhe um conjunto muito mais amplo de palavras relacionadas, em vez de apenas sinónimos). Enquanto brincava com vectores de palavras e a API “HasProperty” da conceptnet, diverti-me um pouco a tentar obter os adjectivos que normalmente descrevem uma palavra. Eventualmente apercebi-me que há uma forma muito melhor de o fazer: parse books!

Project Gutenberg foi o corpus inicial, mas o parser ficou cada vez mais ganancioso e eu acabei por alimentá-lo com cerca de 100 gigabytes de ficheiros de texto – na sua maioria ficção, incluindo muitas obras contemporâneas. O analisador simplesmente olha através de cada livro e retira as várias descrições dos substantivos.

esperançosamente é mais do que uma novidade e algumas pessoas achá-lo-ão de facto útil para a sua escrita e brainstorming, mas uma coisinha limpa a tentar é comparar dois substantivos que são semelhantes, mas diferentes de alguma forma significativa – por exemplo, o género é interessante: “mulher” versus “homem” e “rapaz” versus “rapariga”. Numa análise inital rápida, parece que os autores de ficção têm pelo menos 4x mais probabilidade de descrever as mulheres (em oposição aos homens) com termos relacionados com beleza (no que diz respeito ao seu peso, características e atractividade geral). De facto, “belo” é possivelmente o adjectivo mais utilizado para as mulheres em toda a literatura mundial, o que está bastante de acordo com a representação unidimensional geral das mulheres em muitas outras formas de meios de comunicação. Se alguém quiser fazer mais investigação sobre isto, avise-me e posso dar-lhe muito mais dados (por exemplo, existem cerca de 25000 entradas diferentes para “mulher” – demasiadas para mostrar aqui).

O azul dos resultados representa a sua relativa frequência. Pode pairar sobre um item durante um segundo e a pontuação da frequência deve aparecer. A classificação de “singularidade” é por defeito, e graças ao meu Complicado Algorithm™, ordena-os pela singularidade dos adjectivos a esse substantivo em particular em relação a outros substantivos (na verdade é bastante simples). Como seria de esperar, pode clicar no botão “Ordenar por frequência de utilização” para os adjectivos pela sua frequência de utilização para esse substantivo.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *