Comment créer une table d'instantanés dans Apache Hive

Publié: 2022-11-23

Dans Apache Hive, un instantané est une copie d'une table prise à un moment précis. Une table d'instantanés peut être créée dans n'importe quel format de fichier pris en charge. Les données d'une table d'instantanés sont stockées dans le même format que la table d'origine . Pour créer une table d'instantanés dans Hive, utilisez la commande suivante : CREATE TABLE nom_table_instantané AS SELECT * FROM nom_table_original ;

Qu'est-ce qu'un tableau d'instantanés ?

Source de l'image : https://google.com

En tant que source de données transactionnelles brutes, une table d'instantanés est identique à la source du système transactionnel, avec des champs supplémentaires pour enregistrer la date de l'instantané . Une table d'instantanés est composée de lignes de données qui sont considérées comme effectives au moment de l'extraction (par exemple, actuelles).

Les instantanés de table peuvent aider à la conservation d'un enregistrement de données pendant plus de sept jours. Les instantanés de table vous permettent de conserver les données d'une table dans un état continu aussi longtemps que vous le souhaitez. Cela peut être utile dans les cas où vous aurez besoin de suivre les données pendant une période prolongée, comme la création de rapports ou le suivi.

Les avantages de l'utilisation d'instantanés de base de données

Qu'est-ce qu'un instantané de base de données ? Un instantané SQL Server est un instantané statique en lecture seule d'une base de données stockée dans la base de données. La cohérence de l'instantané de base de données avec la base de données source ne change à aucun moment de sa création. En ce qui concerne le stockage des instantanés de base de données, le serveur qui possède l'instantané a toujours l'instantané de la base de données source. À quoi servent les tables d'instantanés ? Les instantanés de table offrent les avantages suivants : vous pouvez conserver un enregistrement pendant plus de sept jours. Lorsque vous utilisez le voyage dans le temps BigQuery, vous ne pouvez accéder qu'aux données d'une table d'il y a sept jours ou plus récemment. Les instantanés de table vous permettent de conserver les données d'une table à partir d'un point précis dans le temps aussi longtemps que vous le souhaitez. Qu'est-ce qu'une table d'instantanés ? Lorsque des données sont présentes à un moment précis (par exemple, lorsqu'une actualisation a lieu ou lorsque des données sont créées), l'instantané les représente de manière cohérente sur le plan transactionnel (lecture). Pour s'assurer que les données de l'instantané sont relativement constantes avec les données de la table maître, elles doivent être actualisées régulièrement.


Tableau d'instantanés SQL

Source de l'image : https://slidesharecdn.com

Une table d'instantanés est une table créée en tant que copie d'une autre table, généralement dans le but de créer une sauvegarde ou de fournir une vue en lecture seule des données. La table d'instantanés contient les mêmes données que la table d'origine au moment où l'instantané est pris.

Un instantané d'une base de données peut être un outil utile pour les administrateurs. Vous pouvez voir ce qui se passe dans une base de données à un moment précis avec ces outils, éliminant ainsi le besoin de charger la base de données en mémoire, puis de prendre un instantané à ce moment-là. Cette méthode vous permet d'annuler une modification apportée à une base de données qui n'a pas été créée à l'aide de Transact-SQL. Un instantané de base de données peut également être utilisé pour tester les modifications apportées à la base de données sans interférer avec les données en direct. Un instantané d'une base de données peut être créé avant d'apporter des modifications, et il peut être utilisé pour tester les modifications sans affecter les données en direct. Les instantanés de base de données sont accompagnés de certaines restrictions. Par conséquent, ils sont en lecture seule et résident sur la même instance de serveur que la base de données source. Par conséquent, vous ne pourrez pas déplacer une base de données entre les serveurs qui les utilisent. Les instantanés des bases de données SQL Server ne sont pas encore inclus dans SQL Server Management Studio. Si vous devez créer un instantané, un script transcat-SQL est une option.

Requêtes instantanées : ce qu'elles sont et comment les utiliser

Des rapports et des évaluations peuvent être générés à l'aide de requêtes Snapshot . Une requête d'instantané peut être utilisée pour déterminer la durée d'exécution d'une requête spécifique. Pour déterminer l'impact d'une modification de base de données, vous pouvez utiliser une requête d'instantané. Pour les petits ensembles de données, les requêtes d'instantané sont les plus logiques. Pour interroger la base de données dans un instantané, celle-ci doit être en mode lecture seule. Vous pouvez utiliser la requête sp_snapshot pour générer une requête d'instantané. Pour utiliser une requête d'instantané, la base de données source doit être en lecture seule. Pour utiliser une requête d'instantané, la base de données source doit être en lecture seule.

Créer une table d'instantanés BigQuery

Lorsque vous créez une table d'instantanés, BigQuery crée d'abord une nouvelle table vide. Il remplit ensuite la table en analysant la table ou la partition source . Une fois la table d'instantanés créée et remplie, elle devient une table statique en lecture seule. Vous pouvez interroger la table d'instantanés comme n'importe quelle autre table dans BigQuery.

Instantanés de table - Un excellent moyen de documenter l'état de la table

Les instantanés de tables nous permettent de voir comment une table fonctionne à un moment donné. Un instantané peut être utilisé pour suivre la progression d'une requête de longue durée. Un instantané peut également être utilisé pour ramener une table à un état spécifique. Pour créer l'instantané de table, vous devez d'abord avoir accès à la table dont vous souhaitez créer un instantané. Sur la page BigQuery de la console Google Cloud, vous pouvez accéder à la page BigQuery. Dans le volet Explorateur, ajoutez des nœuds de projet et d'ensemble de données à la table dont vous souhaitez créer un instantané. Vous pouvez choisir le nom de la table à capturer. Pour enregistrer un instantané d'une table actuellement stockée dans BigQuery, faites un clic droit dessus et sélectionnez Prendre un instantané. Un instantané du contenu de la table est créé dans le cadre de ce processus. L'heure que vous spécifiez est en heure UTC, qui est l'heure définie par le navigateur. En cliquant sur le bouton Prendre un instantané de table, vous pouvez créer un instantané de table d'une table telle qu'elle était à un moment donné au cours des sept jours précédents. Lorsqu'une date est spécifiée, un instantané de table est créé qui réplique la table telle qu'elle était à ce moment-là. Pour sélectionner un jour spécifique, utilisez simplement le calendrier.

Instantanés de table BigQuery

Les instantanés de table BigQuery permettent de prendre un "instantané" d'une table à un moment donné. Cela peut être utile pour des choses comme la sauvegarde de données ou à des fins d'audit. Les instantanés de table sont stockés sous forme de fichiers dans Google Cloud Storage et peuvent être exportés et importés selon les besoins.

Comment créer une table d'instantanés dans BigQuery ?

Le voyage dans le temps peut être utilisé pour créer un instantané de table. Vous pouvez accéder à BigQuery dans la console Google Cloud en accédant à la page BigQuery. En cliquant sur les nœuds du projet et du jeu de données dans le volet Explorateur, vous pouvez ajouter un instantané de la table. Après avoir cliqué sur le nom de la table, vous verrez un instantané de cette table.