Big data cluster : quelques tests


Une troisième vidéo sur les clusters big data SQL Server 2019.

J’ai voulu cette fois-ci faire quelques tests : performances de chargement et d’interrogation de données.

Les données sont :

Soit stockées dans le storage hdfs du cluster et interrogées directement via Polybase Soit chargées dans le sql data pool distribué, et interrogées aussi via table externe Soit dans une table SQL Server classique.

Je n’ai peut-être pas les volumes nécessaires pour faire du « vrai » big data, mais les performances à l’interrogation de donnéess sont de loin meilleures lorsque c’est une table SQL Server classique (pas de surcharge liée à