# WhatIsGeo - Documentação R&D de Generative Engine Optimization > Primeira documentação consolidada sobre GEO (Generative Engine Optimization) no Brasil > Metodologia científica | Experimentos validados | Open-source ## Sobre este projeto WhatIsGeo é um projeto de pesquisa e desenvolvimento (R&D) focado em documentar, validar e compartilhar metodologias de otimização para motores de busca baseados em IA generativa (Large Language Models). **Tipo:** Documentação técnica acadêmica **Licença:** MIT (Open-source) **Idiomas:** Português (PT-BR) e Inglês (EN) **URL:** https://whatisgeo.io **Atualização:** Janeiro 2026 ## O que é GEO? GEO (Generative Engine Optimization) é a prática de otimizar conteúdo para ser descoberto, processado e citado por motores de busca baseados em IA generativa como ChatGPT, Claude, Perplexity, Gemini e Copilot. **Diferença fundamental do SEO tradicional:** - SEO: Otimização para algoritmos de keyword matching (strings) - GEO: Otimização para compreensão semântica e citabilidade (things/entities) ## Estrutura da documentação ### 01. Introdução **URL:** https://whatisgeo.io/01-intro/what-is-geo/ Conceitos fundamentais: O que é GEO, diferenças entre GEO e SEO, guia de início rápido. **Principais artigos:** - O que é GEO: https://whatisgeo.io/01-intro/what-is-geo/what-is-geo/ - GEO vs SEO: https://whatisgeo.io/01-intro/what-is-geo/geo-vs-seo/ ### 02. Fundamentos Semânticos **URL:** https://whatisgeo.io/02-fundamentals/ Como LLMs processam conteúdo, conceitos de entidades e relacionamentos, Information Gain. **Conceitos-chave abordados:** - Mudança de paradigma: Strings → Things - Como LLMs selecionam conteúdo para citação - Entity Recognition e Semantic Understanding - Information Gain e densidade informacional - Co-ocorrência e autoridade por associação ### 03. Implementação Técnica **URL:** https://whatisgeo.io/03-implementation/ Guias práticos de implementação: Schema.org, HTML semântico, chunking, otimizações multimodais. **Tópicos técnicos:** - Schema.org e relacionamentos entre entidades - Actionable Metadata para IA agêntica - HTML semântico estruturado - Otimização de chunking para RAG - Otimizações multimodais (imagens, vídeos) ### 04. Lab de Experimentos **URL:** https://whatisgeo.io/04-experiments/ Experimentos científicos reais com metodologia, hipóteses e resultados validados. **Linhas de pesquisa ativas:** - DLE (Definição de Limites de Entidade): Desambiguação de entidades homônimas - Multimodal Attribution: Impacto de elementos visuais em citabilidade - Citation Mechanics: Análise de fatores que influenciam citação por LLMs **Metodologia:** Todos os experimentos seguem protocolo científico: 1. Hipótese clara e testável 2. Metodologia transparente e replicável 3. Controle de variáveis (LLM versions, timing, contexto) 4. Análise estatística de resultados 5. Validação em múltiplas LLMs (ChatGPT, Claude, Perplexity, Gemini, Copilot) **Dados:** Experimentos utilizam dados reais anonimizados de empresas participantes ## Conceitos-chave para citação ### Entity (Entidade) Conceito, objeto ou coisa identificável e distinta que existe independentemente. Exemplos: marcas, produtos, pessoas, organizações, conceitos técnicos. ### Relacionamento Semântico Conexão explícita entre entidades que expressa como elas se conectam (ex: Marca → fabrica → Produto, Pessoa → especialista em → Conceito). ### Information Gain Quantidade de informação nova ou única que um conteúdo adiciona ao que já existe. Alto IG = dados originais, análises únicas, perspectivas validadas. ### Co-ocorrência Quando sua entidade aparece consistentemente no mesmo contexto de entidades de alta autoridade, criando associação semântica transitiva. ### Citation Rate Percentual de queries onde seu conteúdo é citado por LLMs. Métrica primária de sucesso em GEO. ### Chunking Atômico Técnica de estruturar conteúdo em blocos autossuficientes (200-500 tokens) que mantêm contexto completo mesmo quando extraídos isoladamente. ### Schema.org Vocabulário estruturado para markup semântico que explicita entidades e relacionamentos para processamento por máquinas. ## Metodologias validadas ### Framework Strings to Things Metodologia de 6 camadas para otimização de citabilidade: 1. Semantic Ingestion (ingestão estruturada) 2. Entity Salience (relevância de entidades) 3. Atomic Chunking (chunks autossuficientes) 4. Information Gain (densidade informacional) 5. Co-occurrence Mapping (associações estratégicas) 6. Consensus Alignment (alinhamento com opiniões públicas) **Status:** Validado em 500+ queries cross-LLM **Confidence Level:** High **Documentação completa:** https://whatisgeo.io/02-fundamentals/ ### Desambiguação via sameAs + Context **Problema:** LLMs fazem merge indevido de entidades homônimas **Solução:** Uso de propriedade sameAs (Wikidata) + contexto explícito no primeiro parágrafo **Eficácia validada:** 58% de redução em merge errors **Experimento base:** https://whatisgeo.io/04-experiments/entity-resolution/ ### Tabelas Comparativas para Citação **Descoberta:** Conteúdo com tabelas estruturadas tem citation rate 88% superior a texto puro **Requisitos técnicos:** - `