À propos de Sarus
Sarus est la couche de confidentialité pour l'analytique et l'IA qui se situe entre les sources de données et les analystes, permettant de travailler sur des données sensibles sans les exposer. Il applique des garanties de confidentialité à chaque requête en utilisant la confidentialité différentielle, des données synthétiques et la réécriture de requêtes préservant la confidentialité, tout en prenant en charge des déploiements sur site ou dans le cloud public. Cette approche aide les cas d'usage en recherche, analytique et IA à exploiter la valeur des données de manière sûre et conforme.
Fonctionnalités clés
- Connecteurs : se connectent nativement aux bases de données, entrepôts de données/lakehouses et stockages cloud sans déplacer les données.
- Politiques de confidentialité : définissent les sorties (données synthétiques, agrégats, sorties à confidentialité différentielle) et assurent l'audit de l'ensemble des traitements.
- Journalisation d'audit : traçage complet des requêtes pour la conformité.
- Données synthétiques : données de haute fidélité formées grâce à la confidentialité différentielle et qui préservent les distributions.
- Analytics & BI : prise en charge de l'API SQL et des connecteurs BI pour les outils courants (Power BI, Tableau, Metabase).
- Machine Learning : SDK Python pour exécuter un traitement de données à distance avec application de la confidentialité différentielle (DP) lorsque nécessaire.
- Action sur les données : pousser les sorties de requêtes vers des endpoints externes sans exposer d'informations personnelles.
- Confidentialité différentielle préservée, réécriture de requêtes axée sur la confidentialité et contrôle au niveau des sorties pour garantir la confidentialité dans des pipelines complexes.
Pourquoi choisir Sarus ?
- Fortes garanties de confidentialité : confidentialité différentielle, données synthétiques et réécriture des requêtes en temps réel sous contrôle des politiques.
- Les données ne quittent jamais le contrôle des propriétaires des données : les analystes travaillent sur des données à distance sans accès direct aux données brutes.
- Conçu pour la conformité : journalisation d’audit détaillée et flux de travail de confidentialité et de conformité rationalisés.
- La valeur des données à travers les silos : libérer les insights issus des données réparties sur plusieurs systèmes sans compromettre la vie privée.
- Prend en charge les flux de travail IA/ML et l’utilisation des LLM avec des garanties de confidentialité.
- Déploiement flexible : sur site ou dans votre cloud public (Docker ou Kubernetes) avec une large gamme de connecteurs sources.