Fin Vision é uma capacidade integrada do Fin AI Agent que permite analisar e entender imagens enviadas por clientes — capturas de tela, fotos e imagens de documentos (por exemplo, páginas escaneadas, fotos de recibos ou formulários) — diretamente nas conversas via chat ou email.
Não é necessário ativar ou configurar nada, e não há custo adicional.
Fin Vision ajuda a:
Diagnosticar problemas mais rapidamente.
Eliminar a necessidade de explicações longas dos clientes.
Extrair e entender conteúdo visual como mensagens de erro, recibos, defeitos de produtos e mais.
Como o Fin Vision funciona
Fin Vision usa modelos multimodais de linguagem grande (LLMs) para analisar imagens enviadas por clientes em conversas por chat ou email.
Quando um cliente compartilha uma imagem, Fin a converte em uma descrição textual estruturada que se torna parte do contexto da conversa. Essa descrição pode incluir:
Texto extraído (OCR) da imagem.
Elementos e rótulos da interface do usuário visíveis em capturas de tela.
Números de referência e detalhes do produto como IDs de pedido ou códigos de erro.
Insights contextuais derivados do que é mostrado na imagem.
Esse entendimento visual permite que Fin raciocine sobre imagens da mesma forma que raciocina sobre mensagens escritas dos clientes.
Com esse contexto, Fin pode:
Pesquisar sua knowledge base de forma mais eficaz.
Resolver Tasks que dependem de entradas visuais.
Fornecer respostas acionáveis baseadas no que o cliente realmente vê.
Fin Vision aplica entendimento multimodal de duas maneiras:
Para interpretar imagens que os clientes enviam em uma conversa.
Para avaliar imagens no seu conteúdo de suporte ao decidir se elas ajudariam a responder a uma pergunta do cliente.
Entendendo análise de imagens vs. respostas com imagens
Fin Vision foca em analisar imagens enviadas por clientes.
Fin também pode incluir imagens do seu conteúdo de suporte existente em suas respostas. Ao decidir se deve incluir uma imagem, Fin analisa a própria imagem usando modelos multimodais, junto com o contexto do trecho ao redor e a resposta que planeja enviar.
Nota:
Fin nunca gera imagens — ele só usa imagens que já existem no seu conteúdo.
As imagens aparecem após a resposta de texto, não embutidas.
Fin não usa metadados de imagem ou texto alternativo ao selecionar imagens.
Fin só pode incluir imagens de fontes de conteúdo que preservam dados de imagem.
Formas de usar o Fin Vision
Indústria | Exemplos de casos de uso |
FinTech |
|
SaaS |
|
ecommerce |
|
Gaming/Gambling |
|
Maximizando Fin Vision
Fin Vision funciona melhor quando combinado com Fin Guidance, que permite definir como Fin deve agir sobre informações visuais.
Use Fin Vision com Fin Guidance
1. Lendo e Interpretando Recibos
Cenário:
Um cliente envia uma foto de um recibo de compra e pergunta: "Você pode me ajudar com o reembolso deste item?"
Como Fin Vision e Guidance Funcionam Juntos:
Fin Vision extrai detalhes importantes da imagem, como o nome do item, data da compra e valor total.
Fin Guidance fornece instruções personalizadas para Fin, como:
"Se um cliente perguntar sobre reembolso e enviar um recibo, verifique se a data da compra está dentro de 30 dias. Se estiver, oriente-o no processo de reembolso. Caso contrário, explique educadamente a política de reembolso."
Resultado:
Fin pode verificar automaticamente a elegibilidade e responder com os próximos passos corretos, referenciando os detalhes extraídos do recibo.
2. Relato de Bug com Capturas de Tela
Cenário:
Um usuário envia uma captura de tela mostrando uma mensagem de erro no app e diz: "Estou recebendo este erro — o que devo fazer?"
Como Fin Vision e Guidance Funcionam Juntos:
Fin Vision analisa a captura de tela para identificar o código ou mensagem de erro.
Fin Guidance instrui Fin a:
"Se um código de erro for detectado em uma captura de tela, pesquise no help center por esse código e forneça as etapas relevantes para solução."
Resultado:
Fin pode rapidamente associar o erro a problemas conhecidos e oferecer suporte direcionado, reduzindo idas e vindas.
3. Identificação de Dispositivo para Suporte
Cenário:
Um cliente envia uma foto do seu dispositivo e pergunta: "Meu dispositivo é compatível com seu serviço?"
Como Fin Vision e Guidance Funcionam Juntos:
Fin Vision identifica a marca e o modelo do dispositivo a partir da imagem.
Fin Guidance diz a Fin:
"Se um modelo de dispositivo for reconhecido, verifique a lista de compatibilidade. Se for compatível, confirme e compartilhe as instruções de configuração. Caso contrário, explique as limitações."
Resultado:
Fin fornece uma resposta personalizada baseada no dispositivo real, melhorando a precisão e a satisfação do cliente.
4. Verificação de Documentos
Cenário:
Um usuário envia uma foto do seu documento de identidade para verificação de conta.
Como Fin Vision e Guidance Funcionam Juntos:
Fin Vision extrai o nome, data de nascimento e tipo de documento.
Fin Guidance instrui Fin a:
"Se o documento enviado for um ID válido e corresponder aos dados da conta, prossiga com a verificação. Caso contrário, solicite uma imagem mais clara ou documentação adicional."
Resultado:
Fin pode automatizar partes do processo de verificação, reduzindo a revisão manual.
Estratégias de Guidance
Lógica Condicional: Fin Guidance pode definir regras baseadas no que Fin Vision detecta (ex.: "Se o recibo tiver mais de 30 dias, faça X").
Alternativas: Se Fin Vision não conseguir extrair as informações necessárias, Guidance pode instruir Fin a pedir ao cliente esclarecimentos ou uma imagem melhor.
Personalização: Guidance pode adaptar respostas com base no contexto visual, tornando as interações mais humanas e relevantes.
Perguntas Frequentes
Quais formatos de imagem o Fin Vision suporta?
Quais formatos de imagem o Fin Vision suporta?
Fin Vision suporta arquivos JPG, PNG, GIF e HEIC compartilhados pelos clientes.
Como o Fin lida com privacidade e informações sensíveis em imagens?
Como o Fin lida com privacidade e informações sensíveis em imagens?
Fin foi projetado com privacidade em mente. Os modelos de visão são explicitamente programados para não extrair informações pessoais ou sensíveis das imagens, como números de cartão de crédito, CVVs ou dados de identificação. Além disso, as imagens são armazenadas temporariamente e excluídas automaticamente após um curto período.
O Fin armazena imagens?
O Fin armazena imagens?
As imagens são armazenadas temporariamente em um ambiente seguro na nuvem e excluídas automaticamente após um curto período.
Os clientes precisam enviar imagens de uma forma específica?
Os clientes precisam enviar imagens de uma forma específica?
Não, os clientes podem enviar ou colar imagens no chat ou e-mail. Fin cuida do resto.
Os clientes podem enviar várias imagens?
Os clientes podem enviar várias imagens?
Sim, Fin analisará as últimas cinco imagens individualmente e usará o contexto para informar as respostas.
O Fin gera ou envia imagens?
O Fin gera ou envia imagens?
Fin não gera imagens. Em algumas conversas, Fin pode incluir imagens do seu conteúdo de suporte existente nas respostas.
O Fin Vision suporta múltiplos idiomas?
O Fin Vision suporta múltiplos idiomas?
Sim, Fin pode extrair texto de imagens em muitos idiomas, embora a precisão dependa da clareza e complexidade.
Posso desativar o Fin Vision?
Posso desativar o Fin Vision?
Não, Fin Vision é integrado e não pode ser desativado. Ele opera automaticamente como parte da compreensão das conversas pelo Fin.
O Fin Vision pode ler documentos?
O Fin Vision pode ler documentos?
Fin agora pode ler o conteúdo de arquivos PDF que os clientes enviam em uma conversa. Quando um cliente compartilha um PDF, Fin extrai o texto do arquivo e o usa como contexto para informar sua resposta — assim como faria com uma mensagem escrita.
Anteriormente, Fin sabia que um PDF havia sido enviado, mas não conseguia lê-lo, o que frequentemente levava a perguntas de acompanhamento ou respostas imprecisas. A leitura de PDF está disponível em todos os planos, sem necessidade de configuração.
Quais tipos de arquivo PDF o Fin pode ler?
Quais tipos de arquivo PDF o Fin pode ler?
Fin pode ler arquivos PDF padrão enviados pelos clientes em uma conversa. O conteúdo do texto é extraído do arquivo e usado para melhorar a resposta do Fin. Fin lê PDFs enviados pelos clientes na conversa — isso é separado do upload de PDFs para sua biblioteca de conteúdo como fonte de knowledge base.
O Fin pode ler imagens HEIC?
O Fin pode ler imagens HEIC?
Sim, o Fin Vision pode ler e processar arquivos High Efficiency Image Container (HEIC) — o formato padrão de fotos dos iPhones. Fin lê imagens HEIC e responde com contexto relevante, assim como qualquer outro formato de imagem suportado.

