Les données prises en charge par le Syntho Engine

Quels types de données sont pris en charge par Syntho ?

Syntho prend en charge toute forme de données tabulaires

Synthé prend en charge toute forme de données tabulaires et prend également en charge les types de données complexes. Les données tabulaires sont un type de données structurées organisées en lignes et en colonnes, généralement sous la forme d'un tableau. La plupart du temps, vous voyez ce type de données dans des bases de données, des feuilles de calcul et d'autres systèmes de gestion de données.

Prise en charge de données complexes

Prise en charge de données complexes

Syntho prend en charge les grands ensembles de données et bases de données multi-tables

Syntho prend en charge les grands ensembles de données et bases de données multi-tables. Également pour les ensembles de données et les bases de données multi-tables, nous maximisons la précision des données pour chaque tâche de génération de données synthétiques et le démontrons via notre rapport sur la qualité des données. De plus, les experts en données de SAS ont évalué et approuvé nos données synthétiques d'un point de vue externe.

Nous avons optimisé notre plate-forme pour minimiser les exigences de calcul (par exemple, aucun GPU requis), sans compromettre la précision des données. De plus, nous prenons en charge la mise à l'échelle automatique, afin que l'on puisse synthétiser d'énormes bases de données.

Spécifiquement pour les ensembles de données et les bases de données multi-tables, nous détectons automatiquement les types de données, les schémas et les formats afin de maximiser la précision des données. Pour la base de données multi-tables, nous prenons en charge l'inférence et la synthèse automatiques des relations de table pour préserver l'intégrité référentielle. Enfin, nous soutenons opérations complètes sur les tables et les colonnes afin que vous puissiez configurer votre travail de génération de données synthétiques, également pour les jeux de données et les bases de données multi-tables.

Intégrité référentielle préservée

Syntho prend en charge l'inférence et la synthèse automatiques des relations de table. Nous déduisons et générons automatiquement des clés primaires et étrangères qui reflètent vos tables source et protégeons les relations dans vos bases de données et entre différents systèmes afin de préserver l'intégrité référentielle. Les relations de clé étrangère sont automatiquement capturées à partir de votre base de données pour préserver l'intégrité référentielle. Alternativement, on peut exécuter une analyse pour rechercher des relations potentielles de clé étrangère (lorsque les clés étrangères ne sont pas définies dans la base de données, mais par exemple dans la couche application) ou on peut les ajouter manuellement.

Opérations complètes sur les tables et les colonnes

Synthétisez, dupliquez ou excluez des tableaux ou des colonnes selon vos préférences. Lorsque vous synthétisez une base de données avec plusieurs tables, vous aimeriez généralement pouvoir configurer le travail de génération de données synthétiques pour inclure et/ou exclure la combinaison de tables souhaitée.

Modes tableau :

  • Synthétiser : utiliser l'IA pour synthétiser le tableau
  • Dupliquer : copier le tableau par-dessus comme si à la base de données cible
  • Exclure : exclure la table de la base de données cible
ensembles de données multi-tables

Prise en charge de données complexes

Syntho prend en charge les données synthétiques contenant des données de séries chronologiques

Syntho prend également en charge les données de séries chronologiques. les données de séries chronologiques sont un type de données qui sont collectées et organisées dans l'ordre chronologique, chaque point de données représentant un point précis dans le temps. Ce type de données est couramment utilisé dans de nombreux secteurs. Cela pourrait par exemple être dans la finance (par exemple avec des clients effectuant des transactions) ou dans les soins de santé (où les patients subissent des procédures), et bien d'autres où les tendances et les modèles au fil du temps sont importants à comprendre.

Les données de séries chronologiques peuvent être collectées à intervalles réguliers ou irréguliers. Les données peuvent être univariées, composées d'une seule variable telle que la température, ou multivariées, composées de plusieurs variables mesurées dans le temps, telles que la valeur d'un portefeuille d'actions ou les revenus et dépenses d'une entreprise.

L'analyse des données de séries chronologiques implique souvent l'identification de modèles, de tendances et de fluctuations saisonnières au fil du temps, ainsi que la réalisation de prédictions sur les valeurs futures basées sur des données passées. Les informations tirées de l'analyse des données de séries chronologiques peuvent être utilisées pour un large éventail d'applications, telles que la prévision des ventes, la prévision de la météo ou la détection d'anomalies dans un réseau. Par conséquent, la prise en charge des données de séries chronologiques est souvent requise lors de la synthèse des données.

Types de données de séries chronologiques pris en charge

Les auto-corrélations sont incluses dans notre rapport d'assurance qualité

Données prises en charge

Syntho prend en charge toute forme de données tabulaires

Type de données Description Exemple
Entier Un nombre entier sans décimales, qu'il soit positif ou négatif 42
flotteur Un nombre décimal avec un nombre fini ou infini de décimales, positives ou négatives 3,14
Boolean Une valeur binaire Vrai ou faux, oui ou non, etc.
Chaîne Une séquence de caractères, tels que des lettres, des chiffres, des symboles ou des espaces, qui représentent du texte, des catégories ou d'autres données "Bonjour le monde!"
Date / Heure Une valeur représentant un point précis dans le temps, soit une date, une heure ou les deux (tout format de données/d'heure est pris en charge) 2023-02-18 13:45:00
Objet Type de données complexe pouvant contenir plusieurs valeurs et propriétés, également appelé dictionnaire, carte ou table de hachage { "name": "John", "age": 30, "address": "123 Main St." }
tableau Une collection ordonnée de valeurs du même type, également appelée liste ou vecteur [1, 2, 3, 4, 5]
Null Une valeur spéciale représentant l'absence de toute donnée, souvent utilisée pour indiquer une valeur manquante ou inconnue nul
Personnage Un seul caractère, tel qu'une lettre, un chiffre ou un symbole 'UNE'
Tout autre Toute autre forme de données tabulaires est prise en charge

Documentation utilisateur

Demandez la documentation utilisateur de Syntho !