Tối ưu hóa truy vấn trong các cơ sở dữ liệu phân tán - 11

Sơ đồ quan hệ giữa các bảng như sau:


3 2 Mô hình phân tán CSDL công cụ ngôn ngữ lập trình Cơ sở dữ liệu được 1


3.2. Mô hình phân tán CSDL, công cụ, ngôn ngữ lập trình

Cơ sở dữ liệu được phân tán trên 3 trạm, sử dụng hệ quản trị CSDL SQL Server 2008

Trạm 1: gồm 2 bảng Customer (18484 bản ghi) và Geography (655 bản ghi).

Trạm 2: bảng IntenetSales (60398 bản ghi)

Trạm 3: bảng Product (606 bản ghi) Diễn giải các bước thực hiện của thuật toán.

Bước 1: Phân tách câu hỏi truy vấn thành các câu hỏi truy vấn trên từng máy trạm

Có thể bạn quan tâm!

Xem toàn bộ 103 trang tài liệu này.

Bước 2: Tìm chi phí lớn nhất khi truyền dữ liệu (bỏ qua tốc độ băng thông mạng)

Chi phí truyền dữ liệu mạng chủ yếu là dung lượng bytes cần truy vấn. Để giảm chi phí truyền thông, chi phí trên máy trạm lớn nhất sẽ không truyền

đi. Thay vào đó các chi phí nhỏ hơn sẽ được truyền đi để thực hiện quá trình tích hợp dữ liệu.

Giao diện chính:


Giao diện kết nối máy trạm 1 Thông tin để kết nối trạm 1 gồm IP máy trạm 2

Giao diện kết nối máy trạm 1

Thông tin để kết nối trạm 1 gồm: IP máy trạm (hoặc tên máy), loại kết nối cơ sở dữ liệu (SQL server, Mysql, Microsoft Access,…), tên truy cập, mật khẩu, tên cơ sở dữ liệu sử dụng.

Giao diện kết nối máy trạm 2 Các thông tin của trạm 2 gồm các thành phần cũng 3

Giao diện kết nối máy trạm 2.

Các thông tin của trạm 2 gồm các thành phần cũng giống như trạm 1


Giao diện kết nối máy trạm 3 Các thông tin của trạm 3 gồm các thành phần cũng 4

Giao diện kết nối máy trạm 3.

Các thông tin của trạm 3 gồm các thành phần cũng giống như trạm 1 và trạm 2

Ứng dụng cho phép truy vấn trên từng máy trạm với các câu truy vấn chỉ lấy 5

Ứng dụng cho phép truy vấn trên từng máy trạm, với các câu truy vấn chỉ lấy dữ liệu trên từng máy đơn lẻ.

3 3 Thuật toán áp dụng Chương trình sẽ cài đặt thử nghiệm thuật toán R 6


3.3. Thuật toán áp dụng

Chương trình sẽ cài đặt thử nghiệm thuật toán R* được trình bày ở mục 2.4.2

3.4. Kết quả thử nghiệm

Thử nghiệm 1: Truy vấn với câu hỏi như sau:

Select Customer. GeographyKey, Customer.FirstName, InternetSales.ProductKey, InternetSales.TotalProductCost From Customer, InternetSales

Where InternetSales.CustomerKey = Customer.CustomerKey


Truy vấn với cơ sở dữ liệu tập trung:

- Thời gian để thực hiện truy vấn và hiển thị là: 1093.75 Milliseconds

- Số lượng bản ghi trả về là 60398


Truy vấn với cơ sở dữ liệu phân tán Thời gian để thực hiện truy vấn và 7


Truy vấn với cơ sở dữ liệu phân tán:

- Thời gian để thực hiện truy vấn và hiển thị là: 1968.75 Miliseconds

- Số lượng bản ghi trả về là 60398


Các bước thực hiện câu truy vấn như hình bên dưới Thử nghiệm 2 Truy vấn 8


Các bước thực hiện câu truy vấn như hình bên dưới:


Thử nghiệm 2 Truy vấn với câu hỏi như sau Select Customer GeographyKey Customer 9

Thử nghiệm 2: Truy vấn với câu hỏi như sau:

Select Customer.GeographyKey, Customer.FirstName, InternetSales.ProductKey, InternetSales.TotalProductCost, Product.EnglishProductName

From Customer, InternetSales, Product

Where InternetSales.CustomerKey = Customer.CustomerKey and Product.ProductKey = InternetSales.ProductKey and Customer.GeographyKey = 11 and Product.Color = ‘Silver’

Truy vấn với cơ sở dữ liệu tập trung:

- Thời gian để thực hiện truy vấn và hiển thị là: 62.5 Milliseconds

- Số lượng bản ghi trả về là 17


Truy vấn với cơ sở dữ liệu phân tán Thời gian để thực hiện truy vấn và 10


Truy vấn với cơ sở dữ liệu phân tán:

- Thời gian để thực hiện truy vấn và hiển thị là: 875 Milliseconds

- Số lượng bản ghi trả về là 17


Các bước thực hiện câu truy vấn như hình bên dưới 11

Các bước thực hiện câu truy vấn như hình bên dưới:


Bản ghi trả về là 17 Các bước thực hiện câu truy vấn như hình bên dưới 12

Xem tất cả 103 trang.

Ngày đăng: 02/10/2023
Trang chủ Tài liệu miễn phí