Starburst, firma zajmująca się otwartymi jeziorami danych, ogłosiła uruchomienie w pełni zarządzanej implementacji Icehouse w Starburst Galaxy, co ma uprościć przepływy pracy związane z analizą danych, poprawić wydajność i obniżyć koszty dla programistów, inżynierów i architektów. Architektura Icehouse, która łączy w sobie moc oprogramowania open-source Trino oraz Apache Icebergma na celu zapewnienie skalowalnego, opłacalnego i […]
Nowy typ danych 8 razy szybszy niż JSON do analizy danych półstrukturalnych
Dane częściowo ustrukturyzowane to dane ułożone w elastycznych formatach. W przeciwieństwie do danych ustrukturyzowanych, nie wymagają one od użytkowników danych wstępnego definiowania schematu tabeli, dzięki czemu zapewniają wygodę przechowywania i analizy danych. Typowe formy danych częściowo ustrukturyzowanych obejmują XML, JSON i pliki dziennika. Są one powszechnie spotykane w następujących scenariuszach branżowych: Handel elektroniczny platformy przechowują […]
Wykonywanie zaawansowanej analizy danych zdarzeń na Facebooku za pomocą wektorowej bazy danych
W dzisiejszej erze cyfrowej profesjonaliści ze wszystkich branż muszą być na bieżąco z nadchodzącymi wydarzeniami, konferencjami i warsztatami. Jednak skuteczne znajdowanie wydarzeń zgodnych z zainteresowaniami wśród ogromnego oceanu informacji online stanowi poważne wyzwanie. Ten blog przedstawia innowacyjne rozwiązanie tego wyzwania: kompleksową aplikację zaprojektowaną do pobierania danych o wydarzeniach z Facebooka i analizowania tych danych za […]
Dekodowanie analizy danych: Przekształcanie tabel krzyżowych w ustrukturyzowane tabele tabelaryczne
Patrząc na dwie poniższe tabele, który format uważa Pan/Pani za bardziej intuicyjny i łatwiejszy do odczytania? Od lat ludzie używają arkuszy kalkulacyjnych do tworzenia tabel krzyżowych (lub warunkowe, wielowymiarowe) raporty lub formularze wypełnienia. Raporty te starannie organizują kategorie, daty i inne punkty danych w poziomy wierszy i kolumn, dzięki czemu są łatwe do odczytania i […]