Fin Vision é uma capacidade integrada do Fin AI Agent que permite analisar e entender imagens enviadas por clientes — capturas de tela, fotos e imagens de documentos (por exemplo, páginas escaneadas, fotos de recibos ou formulários) — diretamente nas conversas via chat ou email.

Não é necessário ativar ou configurar nada, e não há custo adicional.

Fin Vision ajuda a:

Diagnosticar problemas mais rapidamente.
Eliminar a necessidade de explicações longas dos clientes.
Extrair e entender conteúdo visual como mensagens de erro, recibos, defeitos de produtos e mais.

Como o Fin Vision funciona

Fin Vision usa modelos multimodais de linguagem grande (LLMs) para analisar imagens enviadas por clientes em conversas por chat ou email.

Quando um cliente compartilha uma imagem, o Fin a converte em uma descrição textual estruturada que se torna parte do contexto da conversa. Essa descrição pode incluir:

Texto extraído (OCR) da imagem.
Elementos e rótulos da interface do usuário visíveis em capturas de tela.
Números de referência e detalhes do produto como IDs de pedido ou códigos de erro.
Insights contextuais derivados do que é mostrado na imagem.

Esse entendimento visual permite que o Fin raciocine sobre imagens da mesma forma que raciocina sobre mensagens escritas dos clientes.

Com esse contexto, o Fin pode:

Pesquisar sua knowledge base de forma mais eficaz.
Resolver Tasks que dependem de entradas visuais.
Fornecer respostas acionáveis baseadas no que o cliente realmente vê.

Fin Vision aplica o entendimento multimodal de duas maneiras:

Para interpretar imagens que os clientes enviam em uma conversa.
Para avaliar imagens no seu conteúdo de suporte ao decidir se elas ajudariam a responder a uma pergunta do cliente.

Entendendo análise de imagens vs. respostas com imagens

Fin Vision foca em analisar imagens enviadas por clientes.

O Fin também pode incluir imagens do seu conteúdo de suporte existente em suas respostas. Ao decidir se deve incluir uma imagem, o Fin analisa a própria imagem usando modelos multimodais, junto com o contexto do trecho ao redor e a resposta que planeja enviar.

Nota:

O Fin nunca gera imagens — ele usa apenas imagens que já existem no seu conteúdo.
- As imagens aparecem após a resposta de texto, não embutidas.
- O Fin não usa metadados de imagem ou texto alternativo ao selecionar imagens.
- O Fin só pode incluir imagens de fontes de conteúdo que preservam os dados da imagem.

Formas de usar o Fin Vision

Indústria	Exemplos de casos de uso
FinTech	Resolução de erros: Capturas de tela de transferências falhas ou problemas de login ajudam o Fin a fornecer suporte direcionado. Revisão de alertas de fraude: Fin ajuda a identificar capturas de tela de phishing ou atividades suspeitas.
SaaS	Resolução de bugs na interface: Clientes compartilham capturas de tela de erros ou comportamentos inesperados da interface; o Fin extrai mensagens de erro e fornece correções. Ajuda na integração: Fin pode auxiliar clientes em fluxos de interface pouco claros com base em capturas de tela compartilhadas. Verificação de licença: Fin lê chaves de licença ou números de conta a partir de faturas enviadas.
ecommerce	Validação de devolução/reembolso: Clientes enviam imagens de produtos danificados ou incorretos; o Fin avalia a elegibilidade com base nas instruções de Task. Problemas de envio: Clientes compartilham fotos da embalagem ou do conteúdo; o Fin determina itens faltantes ou danos na embalagem. Processamento de faturas: Fin extrai números de pedido e datas de recibos ou notas fiscais.
Gaming/Gambling	Relato de Bug: Jogadores enviam capturas de tela de falhas ou travamentos; o Fin interpreta os visuais e registra os problemas. Problemas de saque: Clientes enviam capturas de tela de transações falhas; o Fin extrai carimbos de data/hora, valores e IDs de transação. Verificação de bilhete de aposta: Fin lê e confirma detalhes do bilhete de aposta a partir de imagens enviadas.

Maximizando o Fin Vision

Fin Vision funciona melhor quando combinado com Fin Guidance, que permite definir como Fin deve agir sobre informações visuais.

Use Fin Vision com Fin Guidance

1. Leitura e Interpretação de Recibos

Cenário:

Um cliente envia uma foto de um recibo de compra e pergunta: "Você pode me ajudar com o reembolso deste item?"

Como Fin Vision e Guidance Trabalham Juntos:

Fin Vision extrai detalhes importantes da imagem, como o nome do item, data da compra e valor total.
Fin Guidance fornece instruções personalizadas para Fin, como:
"Se um cliente perguntar sobre reembolso e enviar um recibo, verifique se a data da compra está dentro de 30 dias. Se estiver, oriente-o no processo de reembolso. Caso contrário, explique educadamente a política de reembolso."

Resultado:
Fin pode verificar automaticamente a elegibilidade e responder com os próximos passos corretos, referenciando os detalhes extraídos do recibo.

2. Relato de Bug com Capturas de Tela

Cenário:
Um usuário envia uma captura de tela mostrando uma mensagem de erro no app e diz: "Estou recebendo este erro — o que devo fazer?"

Como Fin Vision e Guidance Trabalham Juntos:

Fin Vision analisa a captura de tela para identificar o código ou mensagem de erro.
Fin Guidance instrui Fin a:
"Se um código de erro for detectado em uma captura de tela, pesquise no help center por esse código e forneça as etapas relevantes para solução."

Resultado:
Fin pode rapidamente associar o erro a problemas conhecidos e oferecer suporte direcionado, reduzindo idas e vindas.

3. Identificação de Dispositivo para Suporte

Cenário:
Um cliente envia uma foto do seu dispositivo e pergunta: "Meu dispositivo é compatível com seu serviço?"

Como Fin Vision e Guidance Trabalham Juntos:

Fin Vision identifica a marca e o modelo do dispositivo a partir da imagem.
Fin Guidance diz a Fin:
"Se um modelo de dispositivo for reconhecido, verifique a lista de compatibilidade. Se for compatível, confirme e compartilhe as instruções de configuração. Caso contrário, explique as limitações."

Resultado:
Fin fornece uma resposta personalizada baseada no dispositivo real, melhorando a precisão e a satisfação do cliente.

4. Verificação de Documentos

Cenário:
Um usuário envia uma foto do seu documento de identidade para verificação de conta.

Como Fin Vision e Guidance Trabalham Juntos:

Fin Vision extrai o nome, data de nascimento e tipo de documento.
Fin Guidance instrui Fin a:
"Se o documento enviado for um ID válido e corresponder aos dados da conta, prossiga com a verificação. Caso contrário, solicite uma imagem mais clara ou documentação adicional."

Resultado:
Fin pode automatizar partes do processo de verificação, reduzindo a revisão manual.

Estratégias de Guidance

Lógica Condicional: Fin Guidance pode definir regras baseadas no que Fin Vision detecta (ex.: "Se o recibo for mais antigo que 30 dias, faça X").
Fallbacks: Se Fin Vision não conseguir extrair as informações necessárias, Guidance pode instruir Fin a pedir ao cliente esclarecimentos ou uma imagem melhor.
Personalização: Guidance pode adaptar respostas com base no contexto visual, tornando as interações mais humanas e relevantes.

Perguntas Frequentes

Quais formatos de imagem o Fin Vision suporta?

Fin Vision suporta arquivos JPG, PNG, GIF e HEIC compartilhados pelos clientes.

Como o Fin lida com privacidade e informações sensíveis em imagens?

Fin foi projetado com privacidade em mente. Os modelos de visão são explicitamente programados para não extrair informações pessoais ou sensíveis das imagens, como números de cartão de crédito, CVVs ou dados de identificação. Além disso, as imagens são armazenadas temporariamente e excluídas automaticamente após um curto período.

O Fin armazena imagens?

As imagens são armazenadas temporariamente em um ambiente seguro na nuvem e excluídas automaticamente após um curto período.

Os clientes precisam enviar imagens de uma forma específica?

Não, os clientes podem enviar ou colar imagens no chat ou e-mail. Fin cuida do resto.

Os clientes podem enviar várias imagens?

Sim, Fin analisará as cinco imagens mais recentes individualmente e usará o contexto para informar as respostas.

O Fin gera ou envia imagens?

Fin não gera imagens. Em algumas conversas, Fin pode incluir imagens do seu conteúdo de suporte existente nas respostas.

O Fin Vision suporta múltiplos idiomas?

Sim, Fin pode extrair texto de imagens em muitos idiomas, embora a precisão dependa da clareza e complexidade.

Posso desativar o Fin Vision?

Não, Fin Vision é integrado e não pode ser desativado. Ele opera automaticamente como parte da compreensão das conversas pelo Fin.

O Fin Vision pode ler documentos?

Fin agora pode ler o conteúdo de arquivos PDF que os clientes enviam em uma conversa. Quando um cliente compartilha um PDF, Fin extrai o texto do arquivo e o usa como contexto para informar sua resposta — assim como faria com uma mensagem escrita.

Anteriormente, Fin sabia que um PDF havia sido enviado, mas não conseguia lê-lo, o que frequentemente levava a perguntas de acompanhamento ou respostas imprecisas. A leitura de PDF está disponível em todos os planos, sem necessidade de configuração.

Quais tipos de arquivo PDF o Fin pode ler?

Fin pode ler arquivos PDF padrão enviados por clientes em uma conversa. O conteúdo do texto é extraído do arquivo e usado para melhorar a resposta do Fin. Fin lê PDFs enviados por clientes na conversa — isso é separado do upload de PDFs para sua biblioteca de conteúdo como uma knowledge base.

O Fin pode ler imagens HEIC?

Sim, o Fin Vision pode ler e processar arquivos High Efficiency Image Container (HEIC) — o formato padrão de fotos dos iPhones. Fin lê imagens HEIC e responde com contexto relevante, assim como qualquer outro formato de imagem suportado.

Como o Fin Vision entende imagens

Como o Fin Vision funciona

Entendendo análise de imagens vs. respostas com imagens

Formas de usar o Fin Vision

Maximizando o Fin Vision

Use Fin Vision com Fin Guidance

1. Leitura e Interpretação de Recibos

2. Relato de Bug com Capturas de Tela

3. Identificação de Dispositivo para Suporte

4. Verificação de Documentos

Estratégias de Guidance

Perguntas Frequentes

Quais formatos de imagem o Fin Vision suporta?

Como o Fin lida com privacidade e informações sensíveis em imagens?

O Fin armazena imagens?

Os clientes precisam enviar imagens de uma forma específica?

Os clientes podem enviar várias imagens?

O Fin gera ou envia imagens?

O Fin Vision suporta múltiplos idiomas?

Posso desativar o Fin Vision?

O Fin Vision pode ler documentos?

Quais tipos de arquivo PDF o Fin pode ler?

O Fin pode ler imagens HEIC?