O Sarus
Sarus to warstwa prywatności dla analiz i AI, która stoi między źródłami danych a analitykami, umożliwiając pracę na wrażliwych danych bez ich ujawniania. Wprowadza gwarancje prywatności dla każdego zapytania, wykorzystując prywatność różnicową, dane syntetyczne i przepisywanie zapytań z zachowaniem prywatności, przy wsparciu wdrożeń lokalnych lub w chmurze publicznej. Dzięki temu zastosowania w badaniach, analizie i AI mogą bezpiecznie i zgodnie z przepisami wydobywać wartość z danych.
Najważniejsze funkcje
- Konektory: natywnie łączą się z bazami danych, hurtowniami/lakehouse'ami i magazynami w chmurze, bez przemieszczania danych.
- Polityki prywatności: definiują wyjścia (dane syntetyczne, agregaty, wyjścia z różnicową prywatnością) i audyt całego przetwarzania.
- Audyt logów: pełny audyt zapytań dla zgodności.
- Dane syntetyczne: wysokiej wierności dane syntetyczne trenowane z DP, które zachowują rozkłady.
- Analityka i BI: obsługa SQL API i konektorów BI dla popularnych narzędzi (Power BI, Tableau, Metabase).
- Uczenie maszynowe: Python SDK do zdalnego przetwarzania danych z egzekwowaniem prywatności (DP) gdy potrzebne.
- Działanie na danych: wysyłanie wyników zapytań na zewnętrzne punkty końcowe bez ujawniania danych osobowych.
- Prywatność na pierwszym miejscu: DP chroniące prywatność, przepisywanie zapytań z priorytetem prywatności oraz kontrola na poziomie wyjścia, aby zapewnić prywatność w złożonych pipeline'ach.
Dlaczego warto wybrać Sarus?
- Silne gwarancje prywatności: różnicowa prywatność, dane syntetyczne i przepisywanie zapytań na bieżąco zgodnie z polityką prywatności.
- Dane nigdy nie opuszczają kontroli właścicieli danych: analitycy pracują na zdalnych danych, nie mają bezpośredniego dostępu do surowych danych.
- Zgodność i łatwość utrzymania: szczegółowe logi audytu i uproszczone procesy prywatności i zgodności.
- Wartość danych w silo: uzyskuj wgląd w danych w różnych systemach bez naruszania prywatności.
- Wspiera AI/ML i użycie LLM z gwarancjami prywatności.
- Elastyczne wdrożenie: lokalnie lub w chmurze publicznej (Docker lub Kubernetes) z szerokim zestawem konektorów źródeł danych.