Czym jest format parquet? Parquet to kolumnowy typ danych stosowany m.in w rozwiązaniach Big Data. Możemy się z nim spotkać m.in w takich rozwiązaniach jak Hadoop, AWS Athena. Pliki parquet mogą być bez problemu przetwarzane za pomocą pakietu pandas w Python. Typ kolumnowy różni się od typu wierszowego stosowanego m.in. […]
Tag bigdata
1 posta