Documentação

Formatos Suportados

No Nama App, a base principal da inteligência da plataforma é alimentada por conteúdo em texto. Uma boa indexação dos metadados (como nomes dos arquivos e formatação dos documentos) ajuda a criar uma base sólida e confiável para as buscas. A seleção e organização dos arquivos nos formatos corretos são imprescindíveis para acelerar a criação dos modelos e a execução dos projetos.

O Nama App permite importar e gerenciar uma ampla variedade de arquivos, fornecendo uma base de dados rica e diversificada para seus Modelos de Inteligência Artificial. Confira os formatos suportados e as melhores práticas para cada tipo de arquivo:

Textos Simples:

  • .TXT: Ideal para arquivos simples com apenas texto, sem formatação. Esses arquivos são facilmente processados e indexados.

Documentos Formatos Rich Text:

  • .PDF: Extraímos o texto dos PDFs para facilitar a consulta. Certifique-se de que os PDFs contenham texto selecionável, não contenham senha e não estejam protegidos . PDFs com texto claro são essenciais para uma boa indexação e acessibilidade dos dados.

🚧

Arquivos PDF devem ter um conteúdo selecionável, não podem conter senha e não podem estar protegidos.

  • .DOCX: Documentos do Word com formatação completa são ideais para relatórios, tutoriais e treinamentos. A formatação ajuda na estruturação do conteúdo, permitindo que o modelo compreenda melhor a hierarquia e o contexto das informações.
  • .PPTX: Apresentações do PowerPoint podem ser importadas para enriquecer seu Dataset. Embora o foco seja em texto, as notas e os textos nos slides são processados para fornecer insights adicionais.

Planilhas e Dados Tabulares (ideal para a subida de conteúdos em lote):

  • .CSV: Planilhas separadas por vírgula (,) são ótimas para listas de contatos, dados financeiros e outras informações tabulares. A simplicidade do formato CSV facilita a importação e a indexação rápida dos dados.

🚧

Um arquivo CSV não deverá ultrapassar 1.000.000 de caracteres por campo.

_csv.Error: field larger than field limit (1000000)

  • .XLSX: Planilhas do Excel são suportadas. Esses arquivos fornecem dados estruturados que podem ser facilmente integrados ao seu Dataset.

Arquivos compactados:

  • .ZIP: Organize múltiplos arquivos em um único arquivo ZIP e importe-o para o Nama App. Certifique-se de que todos os arquivos no ZIP estejam no formato PDF, pois atualmente APENAS arquivos PDF são compatíveis com o modelo. Esta prática facilita a gestão de grandes volumes de dados de maneira eficiente.

🚧

Melhores Práticas e Cuidados:

Tamanho do Arquivo:

  • Certifique-se de que cada arquivo possui até 250MB. Arquivos maiores podem dificultar a importação e processamento.

Conteúdo do Arquivo:

  • Textos que estão como imagens não serão lidos. Certifique-se de que os documentos contenham texto claro e legível.
  • Metadados e Formatação:
  • Dê nomes descritivos e organizados aos seus arquivos para facilitar a indexação.
    Utilize a formatação adequada nos documentos (como Markdown) para melhorar a extração e interpretação dos dados.

Segurança:

  • Verifique se os arquivos estão livres de vírus e malwares antes de importá-los.

Nota:

Atualmente, não aceitamos outros formatos de arquivo além dos mencionados acima. No entanto, estamos continuamente trabalhando para facilitar a importação de dados, e mais formatos e integrações serão lançados em breve.

Com o Nama App, você tem a liberdade de organizar seus Datasets de maneira eficiente e prática. Explore todas as funcionalidades disponíveis e tenha seu conhecimento sempre à mão!


What’s Next