Passar para o conteúdo principal

Sincronize e gerencie sites

Como sincronizar URLs públicas no Knowledge e habilitar este conteúdo para Fin.

Escrito por Beth-Ann Sher

Se você quiser adicionar conteúdo do site ao Intercom e torná-lo disponível para o Fin AI Agent e o Copilot, pode fazer isso sincronizando a URL pública do seu site. Você também pode treinar Fin e Copilot com conteúdo de postagens de blog, changelogs, atualizações de notícias ou qualquer outra página da web com datas. Isso garante que Fin e Copilot sempre usem as informações mais atualizadas e relevantes dessas fontes.

Nota: Este recurso funciona apenas com URLs públicas. Se o conteúdo que você deseja usar estiver atrás de um login, Fin não poderá acessá-lo ou importá-lo.


Sincronize o conteúdo do site com Fin e Copilot

Vá para Fin AI Agent > Train > Content, depois selecione Sincronização do site em “Adicionar conteúdo.”

Agora insira a URL do seu conteúdo de suporte externo (top-level domain) e clique em Próximo:

Isso buscará todas as páginas da URL do site que você fornecerá e lerá todas as páginas do sub domain.

Dica: Domínios de nível superior darão os melhores resultados (por exemplo, use a URL da página inicial do seu help center externo https://myhelpcenter.com em vez de subpáginas https://myhelpcenter.com/articles).

Nota: A sincronização do site tem um máximo de 100 sites.

Revise as páginas para sincronizar

Depois de inserir sua URL, verificaremos se ela é válida e acessível. Então, você precisará revisar as páginas para sincronizar. Todas as subpáginas vinculadas em cada seção selecionada serão sincronizadas. Selecione apenas conteúdo relevante e atualizado.

Dicas:

  • Selecione páginas e seções que contenham conteúdo de suporte, como artigos de ajuda, guias ou FAQs.

  • Evite selecionar páginas de marketing, listas de produtos ou páginas com layouts complexos.

  • Todas as subpáginas vinculadas dentro das seções selecionadas serão incluídas automaticamente.

  • Você sempre pode atualizar sua seleção mais tarde nas configurações avançadas.

Configurações avançadas [opcional]

Selecione o menu suspenso Configurações avançadas para configurar URLs adicionais, excluir URLs, seletores CSS para excluir, etc.

URLs adicionais

As estruturas dos sites podem variar. Para garantir que sincronizemos seu conteúdo mais relevante, recomendamos que você adicione URLs adicionais para essas subpáginas específicas.

Por exemplo, se você inserir https://myhelpcenter.com/help como a URL principal acima, talvez queira adicionar também a URL específica como https://myhelpcenter.com/help/index.html

URLs para excluir

Para excluir certas páginas das quais você não deseja sincronizar conteúdo, você pode adicionar uma lista de globs de URL.

O que é um glob de URL?

Um glob é uma sequência de caracteres literais e/ou curingas usada para corresponder a caminhos de arquivos ou URLs. Globbing é o ato de localizar arquivos em um sistema de arquivos usando um ou mais globs. Usar globs de URL também ajuda a obter uma variedade de URLs que são quase iguais, com apenas uma pequena parte mudando entre as solicitações.

Por exemplo, este glob de URL https://{store,docs}.example.com/** permite que o rastreador acesse todas as URLs que começam com https://store.example.com/ ou https://docs.example.com/ e https://example.com/**/*\?*foo=*

Dica: Não tem certeza se seu padrão glob corresponderá às URLs que deseja excluir? Você pode usar a Ferramenta Glob da DigitalOcean para testar padrões contra URLs de exemplo antes de aplicá-los. (Esta é uma ferramenta de terceiros não mantida pela Intercom.)

Elementos da página para incluir

Em seguida, você pode selecionar se deseja incluir apenas o conteúdo principal da página ou se deseja incluir ou excluir elementos específicos da página selecionando Personalizado.

Elementos da página para excluir

Para excluir certos elementos da página, você pode usar seletores CSS dessas seções ou elementos específicos que deseja excluir.

Isso é útil para pular conteúdo irrelevante da página. O valor deve ser um seletor CSS válido, aceito pela função document.querySelectorAll(). Por padrão, já removemos elementos comuns de navegação, cabeçalhos, rodapés, modais, scripts e imagens embutidas.

Elementos clicáveis da página

Isso permite que elementos DOM identificados pelo seletor CSS sejam clicados durante o processo de sincronização da web.

Isso é útil para expandir seções recolhidas, a fim de capturar seu conteúdo de texto. O valor deve ser um seletor CSS válido, aceito pela função document.querySelectorAll().

Exemplos são "[aria-expanded=\"false\"]", #expand_section

Condições complexas também podem ser descritas com um seletor CSS. No CSS, encadear seletores sem espaços cria uma condição do tipo E, por exemplo, .button.blue.small corresponderá apenas a elementos com as três classes.

Usar vírgula (,) como separador funciona como OU, por exemplo, .button, .blue, h1 seleciona todos os elementos com a classe button, ou a classe blue, ou os títulos de primeiro nível.

Aguardar o carregamento do elemento da página

Para direcionar conteúdo que pode ter um atraso para aparecer na página, você pode adicionar um seletor CSS que fará o scraper da web esperar antes de capturar o conteúdo.

Isso é útil para páginas nas quais o reconhecimento padrão de carregamento de conteúdo por rede ociosa falha. Definir essa opção desativa completamente o comportamento padrão, e a página será processada somente se o elemento especificado por esse seletor aparecer.

Nota: O valor deve ser um seletor CSS válido, aceito pela função document.querySelectorAll().

Região do proxy

Você pode selecionar um proxy para o rastreador usar se precisar que seu site seja rastreado com um proxy configurado para uma região ou país específico.

Atualmente, suportamos os seguintes proxies:

  • Rotativo: Estados Unidos, Alemanha, França, Reino Unido, Tchéquia, Hungria

  • Estático:

    • Estados Unidos - 119.13.211.225, 161.123.167.215, 94.176.49.232, 185.223.56.90, 154.17.143.135

    • Europa - 178.171.116.231, 206.232.77.243, 206.232.90.11, 209.20.175.180, 45.94.247.149

    • Austrália - 154.220.151.84, 173.254.193.121, 160.224.101.213, 160.224.100.176, 212.70.22.41

Públicos-alvo

A etapa Target permite definir um público padrão para todas as páginas sincronizadas e criar regras baseadas em URL para atribuir automaticamente públicos específicos com base em padrões de URL — sem necessidade de marcação manual.

Primeiro decida se o conteúdo desta fonte está habilitado para Fin AI Agent e/ou Copilot.

Então você pode definir um público Fin padrão para aplicar a todas as páginas sincronizadas desta fonte (se nenhum padrão for definido, o conteúdo será padrão para Everyone), ou criar regras para atribuir públicos específicos com base em padrões de URL.

Por exemplo: Se a URL contiver /uk, atribua o público do Reino Unido. As regras são avaliadas durante a sincronização, então Fin e Copilot sempre fornecem o conteúdo certo para o público certo.

Cada regra suporta três comparadores de URL:

  • Começa com — corresponde a URLs que começam com um prefixo dado.

  • Termina com — corresponde a URLs que terminam com um sufixo dado.

  • Contém — corresponde a URLs que contêm uma substring dada.

Nota:

  • Uma pré-visualização ao vivo mostra quantas páginas correspondem a cada regra, ajudando a validar as regras antes de salvar. Isso requer um sitemap disponível para sua fonte de sincronização web. Sem um sitemap, as regras ainda se aplicam, mas você não pode pré-visualizar as correspondências.

  • As regras são nomeadas automaticamente na criação, mas podem ser renomeadas. É aplicado um máximo de 10 regras por fonte de sincronização web.

  • As regras de público são apenas aditivas: elas adicionam públicos ao conteúdo, mas nunca removem atribuições existentes. Remover uma regra não desfaz suas atribuições passadas de público.

Revisar configurações de sincronização

Finalmente, revise suas configurações de sincronização e clique em Sync website para começar a sincronizar o conteúdo do seu site com o Intercom.


Gerenciar sincronizações de site

Quando a sincronização for concluída, você receberá uma notificação por e-mail e o site aparecerá como uma fonte sincronizada em Fin AI Agent > Train > Content.

Configurar configurações para páginas específicas

Vá para Fin AI Agent > Train > Content, selecione a fonte do site e clique em uma página que você sincronizou. Você encontrará um painel "Detalhes" à direita que contém:

  • Dados: Veja o tipo de conteúdo, idioma, data de criação e última atualização (quando foi sincronizado pela última vez com a fonte).

  • Configurações Fin: Para habilitar/desabilitar para Fin AI Agent e Copilot. Quando habilitado, o conteúdo fica disponível para clientes através do Fin AI Agent e para colegas via Copilot, respectivamente.

  • Link: A URL pública para esta fonte do site.

  • Relatórios: As conversas Fin nas quais esta fonte do site esteve envolvida ou foi resolvida.

  • Tags: Para aplicar suas próprias tags personalizadas para agrupar e organizar conteúdo no Intercom.

  • Pasta: A pasta onde esta URL pública está localizada no Knowledge Hub. Você não pode alterar a pasta do conteúdo sincronizado.

Nota: As fontes do site são somente leitura e não podem ser editadas dentro do Intercom, devem ser editadas na fonte.

Disponibilize para Fin e Copilot

Para disponibilizar uma fonte do site para Fin AI Agent e/ou Copilot, vá para Fin AI Agent > Train > Content, selecione a fonte do site, clique na(s) página(s) ao vivo que você sincronizou e selecione Change AI Agent state > Enable for AI Agent ou Change Copilot state > Enable for Copilot.

Você também pode gerenciar essas configurações a partir de uma página individual no painel "Detalhes", role para baixo até as configurações Fin e escolha se deseja ativar:

  • Fin AI Agent - Esta configuração tornará a URL pública disponível para Fin usar ao responder aos clientes.

  • Copilot - Esta configuração tornará a URL pública disponível para Copilot usar ao responder perguntas dos colegas na inbox via o painel Copilot.

Saiba como configurar o Fin AI Agent para seus clientes ou habilitar sua equipe para usar o Copilot na inbox.

Disponibilize para um público específico

Você pode atribuir públicos ao conteúdo sincronizado automaticamente usando regras baseadas em URL durante a criação da sincronização web, ou manualmente por página. Primeiro, você precisará criar e definir o público que deseja atingir.

Para atribuir um público manualmente a páginas individuais, vá para Fin AI Agent > Train > Content, selecione a fonte do site, clique na(s) página(s) ao vivo que você sincronizou e selecione More actions > Change Fin audience.

Nota:

  • O público padrão para URLs públicas é “Everyone”.

  • Fin respeitará qualquer público que você aplicar a uma URL pública e usará este artigo para responder às perguntas dos clientes somente se corresponder às regras do público.

Adicionar ou editar regras de público em sincronizações existentes

Você não precisa recriar uma sincronização para adicionar segmentação de público. Vá para Fin AI Agent > Train > Content, selecione a fonte, clique no menu de configurações no canto superior direito e selecione Open settings. Navegue até a etapa Target para adicionar ou editar regras baseadas em URL.

Nota: Quando regras de público são adicionadas a uma sincronização web existente, elas se aplicam retroativamente a todo o conteúdo já ingerido dessa fonte — não apenas ao conteúdo novo daqui para frente.

Re-sincronizar ou remover um site como fonte

Se desejar re-sincronizar ou remover uma URL pública como fonte, vá para Fin AI Agent > Train > Content e selecione a fonte. Então clique no menu de configurações no canto superior direito e selecione Re-sync ou Remove this source.

Dica: Re-sincronizações de sites geralmente acontecem semanalmente (dependendo do tamanho da fonte) e podem ser re-sincronizadas manualmente a qualquer momento.

Gerenciar configurações de sincronização de site

Se desejar ajustar as configurações avançadas para uma sincronização de site, vá para Fin AI Agent > Train > Content e selecione a fonte. Então clique no menu de configurações no canto superior direito e selecione Open settings.

Ver histórico de sincronização de site

Você pode ver uma lista das sincronizações de site passadas para saber quando foram executadas pela última vez, quais páginas foram encontradas e quaisquer páginas com falha. Vá para Fin AI Agent > Train > Content, selecione a fonte do site, clique no menu de configurações no canto superior direito e selecione View sync history.


Cada linha na tabela representa uma execução passada ou ativa, e você pode filtrar as execuções por status. Inclui as seguintes informações:

  • Data da sincronização

  • Status

  • Páginas sincronizadas

  • Páginas excluídas

  • Páginas com falha

  • Duração

  • Sincronização iniciada por

Se uma sincronização falhar, você pode passar o mouse sobre o status para ver uma explicação detalhada do motivo.


Solução de problemas da sincronização do site

Problemas comuns

Ao importar conteúdo do site para ativar Fin, você precisa inserir a URL pública. Isso buscará todas as páginas aninhadas sob essa URL e as sincronizará para uso do Fin AI Agent.

Se o importador não retornou o número de páginas esperado, há algumas razões...

A URL fornecida não é o domínio de nível superior

A sincronização do site funciona acessando a URL que você fornece e buscando todas as páginas aninhadas sob essa URL. Essas páginas devem ter o mesmo padrão de URL que a URL fornecida.

Por exemplo, se o domínio de nível superior for https://myhelpcenter.com/home, todas as páginas que você deseja importar devem incluir o prefixo /home na URL, por exemplo, https://myhelpcenter.com/home/article. Se não incluírem, remova o prefixo e use o tronco da URL mais básico, por exemplo, https://myhelpcenter.com, e tente importar novamente.

A URL é privada

Se o conteúdo que você deseja usar estiver atrás de um login, Fin não poderá acessá-lo ou importá-lo.

Limites de páginas

Você pode sincronizar até 100 diferentes domínios de nível superior e Fin sincronizará no máximo 30.000 páginas de cada fonte. A sincronização pode falhar se houver uma quantidade muito grande de conteúdo em uma única página (você será notificado se uma sincronização falhar).

Nota:
Se seu site ultrapassar esse limite de tamanho, você pode tentar a seguinte solução alternativa:

  • Divida o site em seções menores.

  • Sincronize diferentes caminhos de URL separadamente.

  • Isso reduz o tamanho da página por sincronização e ajuda a evitar falhas na sincronização.

Sites restritos a IPs regionais específicos

A sincronização do site da Intercom (usada para adicionar URLs públicas para Fin AI Agent e Copilot) não usa uma string de agente de usuário dedicada e personalizada no momento.


Para identificar ou permitir essas solicitações:

  • Por endereço IP: Nosso rastreador normalmente usa IPs dinâmicos. Se seu site exigir lista de permissões, entre em contato conosco para que possamos habilitar IPs estáticos e específicos por região para seu workspace.

  • Essas solicitações são usadas apenas para sincronização do site. Elas não afetam o tráfego do Messenger ou o rastreamento do usuário final.

Erros de sincronização do site

Ao sincronizar conteúdo, você pode ver diferentes status que indicam o que aconteceu durante o processo. Para ver o status da sincronização do seu site, vá para Fin AI Agent > Train > Content e selecione a fonte do site, depois use o menu suspenso Status para filtrar por:

  • Sincronizando

  • Ativo

  • Falhou

  • Excluído

Aqui está o que cada um significa e o que você pode fazer a seguir:

Sincronizando

A sincronização da página ainda está em andamento. Uma sincronização inicial pode levar de alguns minutos a mais de uma hora, dependendo da quantidade de conteúdo que você tem.

Ativo

A página foi sincronizada com sucesso e pode ser ativada para Fin e Copilot.

Nota: Uma sincronização bem-sucedida nem sempre significa que conseguimos extrair todo o conteúdo da página. Se quiser confirmar a cobertura completa, recomendamos visualizar Fin com as respostas que espera encontrar nessa página.

Excluído

Essas páginas não são sincronizadas intencionalmente porque você as excluiu nas suas configurações de sincronização. Elas não podem ser reprocessadas e não podem ser incluídas, a menos que especificado o contrário.

Falhou

Esses erros significam que a sincronização não foi concluída e podem exigir alterações do seu lado antes de tentar novamente:

1. Erro desconhecido

  • Mensagem: “Esta página não pôde ser acessada. Pode estar lenta ou bloqueada. Tente sincronizar novamente ou entre em contato com o suporte se falhar.”

  • O que significa: Algo nos impediu de acessar a página, mas a causa não está clara.

2. Sessão bloqueada / Limite de taxa

  • Mensagem: “O site está nos impedindo de acessar seu conteúdo. Verifique se está sendo bloqueado por uma configuração anti-rastreador ou firewall. Verifique a configuração do seu site e tente sincronizar novamente. Se o problema persistir, entre em contato com o suporte.”

  • O que significa: Seu site está bloqueando ou limitando ativamente nosso rastreador.

3. Erros de rede, timeout ou similares

  • Mensagem: “Esta página não pôde ser acessada. Pode estar lenta para carregar ou bloqueada por configurações anti-crawler ou firewall. Verifique a configuração do seu site e tente sincronizar novamente. Se o problema persistir, contate o suporte.”

  • O que significa: A página não carregou a tempo ou não pôde ser alcançada devido a problemas de rede ou bloqueio.

4. Duplicado

  • Mensagem: “Esta página tem o mesmo conteúdo que outra que já está sincronizada. Apenas uma versão será incluída.”

  • O que significa: Detectamos conteúdo idêntico em outro lugar, então apenas uma cópia é mantida.

5. Filtragem por palavra-chave

  • Mensagem: “Páginas com palavras-chave como category, collection ou tag na URL são excluídas por padrão, pois geralmente não contêm conteúdo único. Se esta página deve ser incluída, contate o suporte.”

  • O que significa: Essas URLs frequentemente representam listas, não páginas de conteúdo independentes.

6. Código de status 400

  • Mensagem: “O conteúdo da página não pode ser encontrado. Verifique se a URL é válida e se a página carrega sem problemas.”

  • O que significa: A URL pode estar quebrada ou retornando um erro no seu site.

7. URL bloqueada

  • Mensagem: “Este domain do website está bloqueado para sincronização. Se precisar disso, contate o suporte.”

  • O que significa: O domain está intencionalmente excluído da sincronização.


​Você pode tentar sincronizar novamente uma página que falhou passando o mouse sobre a página, selecionando o menu de três pontos e depois escolhendo Resync.

Nota: Website Sync não suporta a importação de arquivos Markdown brutos. Para formatação adequada e detecção de título, você deve fornecer o conteúdo como HTML renderizado ou enviá-lo como um snippet/arquivo. A estrutura Markdown (ex.: # títulos) não será reconhecida a menos que convertida para HTML.

Respondeu à sua pergunta?