Formatos Suportados
No Nama App, a base principal da inteligência da plataforma é alimentada por conteúdo em texto. Uma boa indexação dos metadados (como nomes dos arquivos e formatação dos documentos) ajuda a criar uma base sólida e confiável para as buscas. A seleção e organização dos arquivos nos formatos corretos são imprescindíveis para acelerar a criação dos modelos e a execução dos projetos.
O Nama App permite importar e gerenciar uma ampla variedade de arquivos, fornecendo uma base de dados rica e diversificada para seus Modelos de Inteligência Artificial. Confira os formatos suportados e as melhores práticas para cada tipo de arquivo:
Textos Simples:
- .TXT: Ideal para arquivos simples com apenas texto, sem formatação. Esses arquivos são facilmente processados e indexados.
Documentos Formatos Rich Text:
- .PDF: Extraímos o texto dos PDFs para facilitar a consulta. Certifique-se de que os PDFs contenham texto selecionável, não contenham senha e não estejam protegidos . PDFs com texto claro são essenciais para uma boa indexação e acessibilidade dos dados.
Arquivos PDF devem ter um conteúdo selecionável, não podem conter senha e não podem estar protegidos.
- .DOCX: Documentos do Word com formatação completa são ideais para relatórios, tutoriais e treinamentos. A formatação ajuda na estruturação do conteúdo, permitindo que o modelo compreenda melhor a hierarquia e o contexto das informações.
- .PPTX: Apresentações do PowerPoint podem ser importadas para enriquecer seu Dataset. Embora o foco seja em texto, as notas e os textos nos slides são processados para fornecer insights adicionais.
Planilhas e Dados Tabulares (ideal para a subida de conteúdos em lote):
- .CSV: Planilhas separadas por vírgula (,) são ótimas para listas de contatos, dados financeiros e outras informações tabulares. A simplicidade do formato CSV facilita a importação e a indexação rápida dos dados.
Um arquivo CSV não deverá ultrapassar 1.000.000 de caracteres por campo.
_csv.Error: field larger than field limit (1000000)
- .XLSX: Planilhas do Excel são suportadas. Esses arquivos fornecem dados estruturados que podem ser facilmente integrados ao seu Dataset.
Arquivos compactados:
- .ZIP: Organize múltiplos arquivos em um único arquivo ZIP e importe-o para o Nama App. Certifique-se de que todos os arquivos no ZIP estejam no formato PDF, pois atualmente APENAS arquivos PDF são compatíveis com o modelo. Esta prática facilita a gestão de grandes volumes de dados de maneira eficiente.
Melhores Práticas e Cuidados:
Tamanho do Arquivo:
- Certifique-se de que cada arquivo possui até 250MB. Arquivos maiores podem dificultar a importação e processamento.
Conteúdo do Arquivo:
- Textos que estão como imagens não serão lidos. Certifique-se de que os documentos contenham texto claro e legível.
- Metadados e Formatação:
- Dê nomes descritivos e organizados aos seus arquivos para facilitar a indexação.
Utilize a formatação adequada nos documentos (como Markdown) para melhorar a extração e interpretação dos dados.Segurança:
- Verifique se os arquivos estão livres de vírus e malwares antes de importá-los.
Nota:
Atualmente, não aceitamos outros formatos de arquivo além dos mencionados acima. No entanto, estamos continuamente trabalhando para facilitar a importação de dados, e mais formatos e integrações serão lançados em breve.
Com o Nama App, você tem a liberdade de organizar seus Datasets de maneira eficiente e prática. Explore todas as funcionalidades disponíveis e tenha seu conhecimento sempre à mão!
Updated about 1 month ago