วิธีสร้างตารางสแนปชอตใน Apache Hive

เผยแพร่แล้ว: 2022-11-23

ใน Apache Hive สแน็ปช็อตคือสำเนาของตารางที่ถ่าย ณ เวลาใดเวลาหนึ่ง สามารถสร้างตารางสแนปชอตในรูปแบบไฟล์ที่รองรับ ข้อมูลในตารางสแนปชอตจะถูกจัดเก็บในรูปแบบเดียวกับ ตารางต้นฉบับ หากต้องการสร้างตารางสแน็ปช็อตใน Hive ให้ใช้คำสั่งต่อไปนี้: CREATE TABLE snapshot_table_name AS SELECT * FROM original_table_name;

ตารางภาพรวมคืออะไร?

ที่มาของภาพ: https://google.com

ในฐานะที่เป็นแหล่งข้อมูลดิบ ข้อมูลธุรกรรม ตารางสแนปชอตจะเหมือนกับแหล่งที่มาของระบบธุรกรรม โดยมีฟิลด์เพิ่มเติมสำหรับบันทึก วันที่ของสแนป ชอต ตารางสแนปชอตประกอบด้วยแถวของข้อมูลที่ถือว่ามีผลในขณะที่แยกข้อมูล (เช่น ปัจจุบัน)

ภาพรวมของตาราง สามารถช่วยในการเก็บรักษาบันทึกข้อมูลได้นานกว่าเจ็ดวัน สแนปชอตของตารางช่วยให้คุณสามารถเก็บข้อมูลของตารางในสถานะต่อเนื่องได้นานเท่าที่คุณต้องการ สิ่งนี้มีประโยชน์ในกรณีที่คุณจะต้องติดตามข้อมูลเป็นระยะเวลานาน เช่น การรายงานหรือการติดตาม

ประโยชน์ของการใช้ภาพรวมฐานข้อมูล

สแนปชอตฐานข้อมูลคืออะไร สแน็ปช็อตของ SQL Server เป็นสแน็ปช็อตแบบคงที่แบบอ่านอย่างเดียวของฐานข้อมูลที่จัดเก็บไว้ในฐานข้อมูล ไม่มีการเปลี่ยนแปลงความสอดคล้องของสแน็ปช็อตของฐานข้อมูลกับ ฐานข้อมูลต้นทาง เมื่อใดก็ได้ในระหว่างการสร้าง เมื่อพูดถึงการจัดเก็บ snapshot ของฐานข้อมูล เซิร์ฟเวอร์ที่มี snapshot จะมี snapshot ของฐานข้อมูลต้นทางเสมอ ตารางภาพรวมใช้สำหรับอะไร สแนปชอตของตารางมีข้อดีดังต่อไปนี้: คุณสามารถเก็บบันทึกได้นานกว่าเจ็ดวัน เมื่อใช้การเดินทางข้ามเวลาของ BigQuery คุณจะเข้าถึงได้เฉพาะข้อมูลของตารางเมื่อเจ็ดวันที่แล้วหรือเร็วกว่านั้น สแนปชอตของตารางทำให้คุณสามารถเก็บข้อมูลของตารางจากช่วงเวลาหนึ่งๆ ได้นานเท่าที่คุณต้องการ ตารางภาพรวมคืออะไร? เมื่อข้อมูลแสดง ณ เวลาใดเวลาหนึ่ง (เช่น เมื่อมีการรีเฟรชหรือเมื่อสร้างข้อมูล) สแน็ปช็อตจะแสดงในลักษณะที่สอดคล้องกันในเชิงธุรกรรม (อ่าน) เพื่อให้แน่ใจว่าข้อมูลของสแน็ปช็อตค่อนข้างคงที่กับข้อมูลของตารางหลัก จะต้องรีเฟรชเป็นประจำ


ตารางสแนปชอตตร

ที่มาของภาพ: https://slidesharecdn.com

ตารางสแนปชอตคือตารางที่สร้างขึ้นเป็นสำเนาของตารางอื่น โดยทั่วไปเพื่อจุดประสงค์ในการสร้างข้อมูลสำรองหรือจัดเตรียมมุมมองข้อมูลแบบอ่านอย่างเดียว ตารางสแนปชอตมีข้อมูลเดียวกันกับตารางต้นฉบับในขณะที่ถ่ายภาพสแนปชอต

สแน็ปช็อตของฐานข้อมูลสามารถเป็นเครื่องมือที่มีประโยชน์สำหรับผู้ดูแลระบบ คุณสามารถดูสิ่งที่เกิดขึ้นในฐานข้อมูล ณ เวลาใดเวลาหนึ่งด้วยเครื่องมือเหล่านี้ ทำให้ไม่จำเป็นต้องโหลดฐานข้อมูลลงในหน่วยความจำแล้วถ่ายภาพ ณ จุดนั้น วิธีนี้ทำให้คุณสามารถย้อนกลับการเปลี่ยนแปลงไปยังฐานข้อมูลที่ไม่ได้สร้างโดยใช้ Transact-SQL สแนปชอตของฐานข้อมูลยังสามารถใช้เพื่อทดสอบการเปลี่ยนแปลงในฐานข้อมูลโดยไม่รบกวนข้อมูลสด สามารถสร้างสแน็ปช็อตของฐานข้อมูลก่อนทำการเปลี่ยนแปลง และสามารถใช้ทดสอบการเปลี่ยนแปลงได้โดยไม่ส่งผลกระทบต่อข้อมูลสด สแน็ปช็อตของฐานข้อมูลมาพร้อมกับข้อจำกัดบางประการ เป็นผลให้เป็นแบบอ่านอย่างเดียวและอยู่บนเซิร์ฟเวอร์อินสแตนซ์เดียวกันกับฐานข้อมูลต้นทาง ดังนั้น คุณจะไม่สามารถย้ายฐานข้อมูลระหว่างเซิร์ฟเวอร์โดยใช้ฐานข้อมูลเหล่านั้นได้ สแนปชอตของฐานข้อมูล SQL Server ยังไม่รวมอยู่ใน SQL Server Management Studio หากคุณต้องการสร้างสแน็ปช็อต สคริปต์ transcat-SQL เป็นตัวเลือก

แบบสอบถาม Snapshot: คืออะไรและใช้อย่างไร

สามารถสร้างรายงานและการประเมินได้โดยใช้ แบบสอบถาม Snapshot แบบสอบถามสแนปชอตสามารถใช้เพื่อกำหนดระยะเวลาที่ใช้ในการดำเนินการค้นหาเฉพาะ เมื่อต้องการกำหนดผลกระทบของการเปลี่ยนแปลงฐานข้อมูล คุณสามารถใช้แบบสอบถามสแน็ปช็อต สำหรับชุดข้อมูลขนาดเล็ก แบบสอบถามสแน็ปช็อตเหมาะสมที่สุด ในการสืบค้นฐานข้อมูลในสแน็ปช็อต จะต้องอยู่ในโหมดอ่านอย่างเดียว คุณสามารถใช้แบบสอบถาม sp_snapshot เพื่อสร้างแบบสอบถามสแน็ปช็อต หากต้องการใช้แบบสอบถามสแน็ปช็อต ฐานข้อมูลต้นทางจะต้องเป็นแบบอ่านอย่างเดียว หากต้องการใช้แบบสอบถามสแน็ปช็อต ฐานข้อมูลต้นทางจะต้องเป็นแบบอ่านอย่างเดียว

Bigquery สร้างตารางภาพรวม

เมื่อคุณสร้างตารางสแนปชอต BigQuery จะสร้างตารางใหม่ที่ว่างเปล่าก่อน จากนั้นจะเติมตารางโดยการสแกน ตารางต้นฉบับ หรือพาร์ติชัน หลังจากสร้างและเติมตารางสแนปชอตแล้ว ตารางนั้นจะกลายเป็นตารางคงที่แบบอ่านอย่างเดียว คุณค้นหาตารางสแนปชอตได้เช่นเดียวกับตารางอื่นๆ ใน BigQuery

ภาพรวมของตาราง - วิธีที่ยอดเยี่ยมในการจัดทำเอกสารสถานะตาราง

ภาพรวมของตารางช่วยให้เราเห็นว่าตารางทำงานเป็นอย่างไรในช่วงเวลาหนึ่งๆ สามารถใช้สแน็ปช็อตเพื่อติดตามความคืบหน้าของคิวรีที่ใช้เวลานาน นอกจากนี้ยังสามารถใช้สแน็ปช็อตเพื่อแปลงตารางกลับเป็นสถานะเฉพาะได้อีกด้วย หากต้องการสร้างสแนปชอตของตาราง คุณต้องมีสิทธิ์เข้าถึงตารางที่คุณต้องการสแนปชอตก่อน ในหน้า BigQuery ของ Google Cloud Console คุณจะไปที่หน้า BigQuery ได้ ในบานหน้าต่าง Explorer ให้เพิ่มโหนดโปรเจ็กต์และชุดข้อมูลลงในตารางที่คุณต้องการสแน็ปช็อต คุณสามารถเลือกชื่อตารางเพื่อถ่ายภาพ หากต้องการบันทึกสแนปชอตของตารางที่จัดเก็บไว้ใน BigQuery ในปัจจุบัน ให้คลิกขวาที่ตารางแล้วเลือกถ่ายภาพสแนปชอต สแนปชอตของเนื้อหาของตารางจะถูกสร้างขึ้นโดยเป็นส่วนหนึ่งของกระบวนการนี้ เวลาที่คุณระบุเป็นเวลา UTC ซึ่งเป็นเวลาที่เบราว์เซอร์ตั้งไว้ เมื่อคลิกปุ่ม Take snapshot of table คุณสามารถสร้างภาพรวมตารางของตารางตามเวลาที่กำหนดในเจ็ดวันก่อนหน้า เมื่อระบุวันที่แล้ว สแนปชอตของตารางจะถูกสร้างขึ้นโดยจำลองตารางตามเดิมในขณะนั้น หากต้องการเลือกวันที่เจาะจง เพียงใช้ปฏิทิน

ภาพรวมตาราง Bigquery

ภาพรวมของตาราง BigQuery เป็นวิธีการถ่ายภาพ "ภาพรวม" ของตาราง ณ เวลาใดเวลาหนึ่ง สิ่งนี้มีประโยชน์สำหรับสิ่งต่าง ๆ เช่น การเก็บสำรองข้อมูล หรือเพื่อวัตถุประสงค์ในการตรวจสอบ สแนปชอตของตารางจัดเก็บเป็นไฟล์ใน Google Cloud Storage และสามารถส่งออกและนำเข้าได้ตามต้องการ

ฉันจะสร้างตารางภาพรวมใน Bigquery ได้อย่างไร

การเดินทางข้ามเวลาสามารถใช้เพื่อสร้างสแนปชอตของตารางได้ คุณเข้าถึง BigQuery ได้ใน Google Cloud Console โดยไปที่หน้า BigQuery เมื่อคลิกที่โหนดโปรเจ็กต์และชุดข้อมูลในบานหน้าต่าง Explorer คุณสามารถเพิ่มสแนปชอตของตารางได้ หลังจากคลิกชื่อตารางแล้ว คุณจะเห็นภาพรวมของตารางนั้น