Bài 6: Stored Procedure và T-SQL nâng cao

Trong bài này chúng ta sẽ tìm hiểu một số cách import và export dữ liệu trong SQL Server. Sau đó sẽ tìm hiểu các loại Stored Procedure và Cursor trong SQL Server.


Nội dung bài học


Sử dụng bcp hoặc BULK INSERT để import dữ liệu

bcp là câu lệnh được thực hiện trong cửa sổ Command Prompt dùng để import hoặc export dữ liệu từ một file dữ liệu (File Text hoặc File Excel) vào SQL Server và ngược lại.

Các cách import khác nhau:

  • Từ một Hệ quản trị cở sở dữ liệu khác như Oracle, DB2… sang SQL Server, cách đơn giản là  export dữ liệu ra một text file sau đó import vào SQL Server dùng câu lệnh bcp.
  • Từ cùng hệ quản trị CSDL SQL Server, có thể export ra các file dạng backup hoặc file SQL rồi restore lại ở hệ quản trị CSDL kia, hoăc chuyển sang một tệp Microsoft Excel và từ file Excel này ta có thể làm đầu vào cho một chương trình khác hoặc một hệ quản trị cơ sở dữ liệu khác.

Chúng ta cũng có thể chuyển dữ liệu vào SQL Server dùng câu lệnh BULK INSERT. Tuy nhiên BULK INSERT chỉ có thể import dữ liệu vào trong SQL Server chứ không thể export dữ liệu ra một file dữ liệu như bcp.

Ðể có thể insert dữ liệu vào CSDL SQL Server, file dữ liệu phải có dạng bảng nghĩa là có cấu trúc hàng và cột. Chú ý khi dữ liệu được bulk copy (copy hàng loạt dùng bcp hoặc BULK INSERT) vào một table trong SQL Server thì table đó phải tồn tại và dữ liệu được thêm vào những dữ liệu đã tồn tại trước (append). Ngược lại khi export data ra một data file thì một file mới sẽ được tạo ra hoặc data file sẽ bị overwrite nếu nó tồn tại.

Cú pháp đầy đủ của lệnh bcp có thể xem SQL Server Books Online.

Ví dụ 1: Giả sử bạn muốn export dữ liệu từ bảng KhachHang trong QLKhachHang (đây là database được tạo ra trong bài tập số 1  ) ra một text file trong đó các cột được phân cách bằng dấu “;”. Bạn có thể làm như sau: mở DOS command prompt và đánh vào dòng lệnh sau:


bcp QLKhachHang.KhachHang out c:\KhachHang.txt -c –T –t;

Trong ví dụ trên ta thực hiện câu lệnh bcp để copy bảng KhachHang ra một file text trong đó :

out: tham số này để xuất dữ liệu từ table hay view ra một file (c:\KhachHang.txt). Ngược lại ta có thể tham số in để import dữ liệu từ file text vào SQL Server.

-c: thực thi các thao tác sử dụng kiểu dữ liệu ký tự (char) (nếu không chỉ rõ thì SQL Server sử dụng mặc định là kiểu char, sẽ dùng “TAB” character (\t) để phân định các cột và dùng new line character (\n) để phân định các hàng).

-t;: dấu “;” đi sau switch “t” cho biết ta muốn dùng “;” để tách các cột (nếu không sẽ dùng giá trị mặc định như trên)

-T: sử dụng Trust connection để kết nối với database, tức là sử dụng tài khoản đăng nhập của Windows để sử dụng SQL Server. Nếu không sử dụng tham số này thì cần chỉ định hai tham số –U và –P cho tên đăng nhập và mật khẩu của SQL Server để đăng nhập.

Ví dụ 2: Thay vì copy toàn bộ table ta có thể dùng query để select một phần dữ liệu và export ra file text như sau:


bcp "Select * From QLKhachHang.KhachHang" queryout c:\KhachHang.txt -c -S TienPT -U sa -P abc

Trong ví dụ này ta Select toàn bộ dữ liệu trong Orders table ra một text file dùng query và SQL Server authentication.

queryout : cho biết đây là một query chứ không phải là table.

-S : tên của SQL Server (hay tên của một Instance)

-U : tên người dùng để đăng nhập SQL Server

-P : mật khẩu để đăng nhập

Ví dụ 3 : dùng BULK INSERT để copy dữ liệu từ file text vào CSDL SQL Server. Mở New Query (vì BULK INSERT là một câu lệnh T-SQL chứ không phải thực hiện trên cửa sổ Command Prompt) và đánh vào các dòng sau :


BULK INSERT QLKhachHang.KhachHang FROM 'c:\KhachHang.txt ' WITH (DATAFILETYPE = 'CHAR')

Trong ví dụ trên DATAFILETYPE= ‘CHAR’ cho biết dữ liệu được chứa dạng kiểu dữ liệu Char. Nêú muốn dùng kiểu dữ liệu dạng unicode thì dùng ‘WIDECHAR’

Chú ý: Các câu lệnh bcp phân biệt chữa hoa chữ thường.


Truy vấn phân tán

Ðôi khi chúng ta muốn select dữ liệu từ những hệ quản trị CSDL khác như MS Access, Oracle, DB2… hay thậm chí từ một SQL Server khác thì ta cần phải dùng truy vấn phân tán (distributed query). SQL Server sẽ dùng kỹ thuật OLEDB và các API để chuyển các truy vấn này tới các hệ quản trị CSDL khác. Có 2 cách để truy cập vào các hệ quản trị CSDL này là dùng LINKED SERVERAd Hoc Computer Name.

Linked Server

Linked Server là một server ảo được dùng để truy cập vào các hệ cơ sở dữ liệu khác. Một khi đã setup thì ta có thể query data dùng four-part name : linked_server_name.catalog.schema.object_name . Trong đó catalog thường tương đương với database name, Schema tương đương với database owner và object_name tương đương với table hay view.

Ví dụ: Giả sử ta setup một Linked Server vào Access database “QLKhachHang.mdb” trong đó các table đều tương tự như CSDL QLKhachHang trong SQL Server (được tạo ra từ  bài tập số 1).

Mở SQL Server Management Studio -> Server Objects -> Kích chuột phải rồi chọn New ->Linked Server. Sau đó nhập vào tên của Linked serverLinkedQLKhachHang, trong phần Provider chọn Microsoft Jet 4.0 OLEDB Provider. Trong phần Data Source nhập đường dẫn của file Access ví dụ như C:\QLKhachHang.mdb rồi kích OK.

Ta sẽ có Linked Server tên LinkedQLKhachHang xuất hiện dưới phần Server Objects/Linked Servers. Giả sử ta muốn select dữ liệu  từ Linked Server này ta có thể dùng câu truy vấn như sau:

	
Select * From LinkedQLKhachHang...KhachHang

Trong ví dụ trên ta dùng tên của Linked Server và theo sau là ba chấm (vì để truy cập vào database ta phải dùng four-part name nhưng trong trường hợp này ta dùng default value nên không cần cho biết tên của Catalog và Schema nhưng phải dùng dấu chấm để phân biệt từng phần).

Ngoài cách trên ta có thể dùng pass-through query với OPENQUERY function như sau:


Select * from OPENQUERY(LinkedPracticeDB,'Select * from Customers')

Trong ví dụ trên ta thấy function OPENQUERY sẽ trả về một data set và có thể nằm sau keyword FROM như một table. Khi dùng OPENQUERY function ta cần cho biết tên của Linked Server và query mà ta muốn thực hiện.

Lưu ý: function trong SQL Server được dùng tương tự như là stored procedure.

Ad Hoc Computer Name

Ngoài cách dùng Linked Server như đã trình bày ở trên ta có thể dùng ad hoc computer name (ad hoc nghĩa là lâm thời, tạm thời). Nghĩa là đối với những database system mà ta thường xuyên query thì dùng Linked Server còn đối với những query lâu lâu mới dùng đến thì ta có thể select data bằng OPENROWSET hay OPENDATASOURCE functions

Ví dụ: ta cũng sẽ select data từ Access database như trên dùng OPENROWSET

	Select * from OPENROWSET('Microsoft.jet.oledb.4.0','C:\PracticeDB.mdb'; 'admin'; '', Customers)

Trong ví dụ trên khi dùng OPENROWSET ta cần phải đưa vào tất cả những thông tin cần thiết để connect vào database như tên của Provider, vị trí của file, username, password (trường hợp này không có password) và tên của table mà ta muốn select. Mỗi lần ta thực thi câu lệnh trên SQL Server đều kiểm tra security trong khi đó nếu dùng Linked Server thì chỉ kiểm ta một lần mà thôi. OPENROWSET tương tự như OPENQUERY ở chỗ nó trả về một rowset và có thể đặt vào vị trí của một table trong câu lệnh query.

Ngoài cách dùng trên ta cũng có thể dùng OPENDATASOURCE để query như sau:


Select * from OPENDATASOURCE('Microsoft.jet.oledb.4.0','Data Source = C:\PracticeDB.mdb; User ID = Admin; Password = ')
				...Customers

Trong ví dụ trên ta thấy OPENDATASOURCE trả về một phần của four-part name (nghĩa là tương đương với tên của Linked Server) cho nên ta phải dùng thêm ba dấu chấm.


Cursor

Nếu giải thích một cách ngắn gọn thì cursor tương tự như recordset hay dataset trong lập trình. Nghĩa là ta select một số data vào memory sau đó có thể lần lượt làm việc với từng record bằng cách Move Next…

Có 3 loại cursors là Transact-SQL Cursor, API Cursors và Client Cursors. Trong đó Transact-SQL và API thuộc loại Server Cursors nghĩa là cursors được load lên và làm việc bên phía server. Trong khuôn khổ bài học này ta chỉ nghiên cứu Transact-SQL cursors.

Transact-SQL cursors được tạo ra trên server bằng các câu lệnh Transact-SQL và chủ yếu được dùng trong stored procedures và triggers. Trước hết hãy xem qua một ví dụ về cursor:

	DECLARE @au_lname varchar(40), @au_fname varchar(20)

	DECLARE Employee_Cursor CURSOR FOR 
	SELECT LastName, FirstName FROM Northwind.dbo.Employees 

	OPEN Employee_Cursor 

	FETCH NEXT FROM Employee_Cursor INTO @au_lname, @au_fname 
	WHILE @@FETCH_STATUS = 0 
	BEGIN 
		PRINT 'Author:' + @au_fname + ' ' + @au_lname
		FETCH NEXT FROM Employee_Cursor INTO @au_lname, @au_fname
	END
 
	CLOSE Employee_Cursor
 
	DEALLOCATE Employee_Cursor

Trong ví dụ ở trên ta sẽ select LastName và FirstName từ Employees table của Northwind database và load vào Employee_Cursor sau đó lần lượt in tên của các employee ra màn hình. Ðể làm việc với một cursor ta cần theo các bước sau:

  1. Dùng câu lệnh DECLARE CURSOR để khai báo một cursor. Khi khai báo ta cũng phải cho biết câu lệnh SELECTsẽ được thực hiện để lấy data.
  2. Dùng câu lệnh OPEN để đưa data lên memory (populate data). Ðây chính là lúc thực hiện câu lệnh SELECT vốn được khai báo ở trên.
  3. Dùng câu lệnh FETCH để lấy từng hàng data từ record set. Cụ thể là ta phải gọi câu lệnh FETCH nhiều lần. FETCH tương tự như lệnh Move trong ADO recordset ở chỗ nó có thể di chuyển tới lui bằng câu lệnh FETCH FIRST, FETCH NEXT, FETCH PRIOR, FETCH LAST, FETCH ABSOLUTE n, FETCH RELATIVE n nhưng khác ở chỗ là nó lấy data bỏ vào trong variable (FETCH…FROM…INTO variable_name). Thông thường ta FETCH data trước sau đó loop cho tới record cuối của Cursor bằng vòng lặp WHILE bằng cách kiểm tra global variable @@FETCH_STATUS (=0 nghĩa là thành công).
  4. Khi ta viếng thăm từng record ta có thể UPDATE hay DELETE tùy theo nhu cầu (trong thí dụ này chỉ dùng lệnh PRINT)
  5. Dùng câu lệnh CLOSE để đóng cursor. Một số tài nguyên (memory resource) sẽ được giải phóng nhưng cursor vẫn còn được khai báo và có thể OPEN trở lại.
  6. Dùng câu lệnh DEALLOCATE để phóng thích hoàn toàn các tài nguyên dành cho cursor (kể cả tên của cursor).

Lưu ý là trong ví dụ ở trên trước khi dùng Cursor ta cũng declare một số variable (@au_fname và @au_lname) để chứa các giá trị lấy được từ cursor. Bạn có thể dùng Query Analyzer để chạy thử ví dụ trên.


Stored Procedures

Trong những bài học trước đây khi dùng Query Analyzer chúng ta có thể đặt tên và save các nhóm câu lệnh SQL vào một file dưới dạng script để có thể sử dụng trở lại sau này. Tuy nhiên thay vì save vào text file ta có thể save vào trong SQL Server dưới dạng Stored Procedure. Stored Procedure là một nhóm câu lệnh Transact-SQL đã được compiled (biên dịch) và chứa trong SQL Server dưới một tên nào đó và được xử lý như một đơn vị (chứ không phải nhiều câu SQL riêng lẻ).

Ưu Ðiểm Của Stored Procedure

Stored Procedure có một số ưu điểm chính như sau:

  • Performance : Khi thực thi một câu lệnh SQL thì SQL Server phải kiểm tra permission xem user gởi câu lệnh đó có được phép thực hiện câu lệnh hay không đồng thời kiểm tra cú pháp rồi mới tạo ra một execute plan và thực thi. Nếu có nhiều câu lệnh như vậy gởi qua network có thể làm giảm đi tốc độ làm việc của server. SQL Server sẽ làm việc hiệu quả hơn nếu dùng stored procedure vì người gởi chỉ gởi một câu lệnh đơn và SQL Server chỉ kiểm tra một lần sau đó tạo ra một execute plan và thực thi. Nếu stored procedure được gọi nhiều lần thì execute plan có thể được sử dụng lại nên sẽ làm việc nhanh hơn. Ngoài ra cú pháp của các câu lệnh SQL đã được SQL Sever kiểm tra trước khi save nên nó không cần kiểm lại khi thực thi.
  • Programming Framework : Một khi stored procedure được tạo ra nó có thể được sử dụng lại. Ðiều này sẽ làm cho việc bảo trì (maintainability) dễ dàng hơn do việc tách rời giữa business rules (tức là những logic thể hiện bên trong stored procedure) và database. Ví dụ nếu có một sự thay đổi nào đó về mặt logic thì ta chỉ việc thay đổi code bên trong stored procedure mà thôi. Những ứng dụng dùng stored procedure này có thể sẽ không cần phải thay đổi mà vẫn tương thích với business rule mới. Cũng giống như các ngôn ngữ lập trình khác stored procedure cho phép ta đưa vào các input parameters (tham số) và trả về các output parameters đồng thời nó cũng có khả năng gọi các stored procedure khác.
  • Security : Giả sử chúng ta muốn giới hạn việc truy xuất dữ liệu trực tiếp của một user nào đó vào một số tables, ta có thể viết một stored procedure để truy xuất dữ liệu và chỉ cho phép user đó được sử dụng stored procedure đã viết sẵn mà thôi chứ không thể “đụng” đến các tables đó một cách trực tiếp. Ngoài ra stored procedure có thể được encrypt (mã hóa) để tăng cường tính bảo mật.

Các Loại Stored Procedure

Stored procedure có thể được chia thành 5 nhóm như sau:

    1. System Stored Prcedure : Là những stored procedure chứa trong Master database và thường bắt đầu bằng tiếp đầu ngữ sp_ . Các stored procedure này thuộc loại built-in và chủ yếu dùng trong việc quản lý database (administration) và security. Ví dụ bạn có thể kiểm tra tất cả các processes đang được sử dụng bởi user DomainName\Administrators bạn có thể dùngsp_who @loginame=’DomainName\Administrators’.Có hàng trăm system stored procedure trong SQL Server. Bạn có thể xem chi tiết trong SQL Server Books Online.
  • Local Stored Procedure : Ðây là loại thường dùng nhất. Chúng được chứa trong user database và thường được viết để thực hiện một công việc nào đó. Thông thường người ta nói đến stored procedure là nói đến loại này. Local stored procedure thường được viết bởi DBA hoặc programmer. Chúng ta sẽ bàn về cách tạo stored prcedure loại này trong phần kế tiếp.
  • Temporary Stored Procedure : Là những stored procedure tương tự như local stored procedure nhưng chỉ tồn tại cho đến khi connection đã tạo ra chúng bị đóng lại hoặc SQL Server shutdown. Các stored procedure này được tạo ra trên TempDB của SQL Server nên chúng sẽ bị delete khi connection tạo ra chúng bị cắt đứt hay khi SQL Server down. Temporary stored procedure được chia làm 3 loại : local (bắt đầu bằng #), global (bắt đầu bằng ##) và stored procedure được tạo ra trực tiếp trên TempDB. Loại local chỉ được sử dụng bởi connection đã tạo ra chúng và bị xóa khi disconnect, còn loại global có thể được sử dụng bởi bất kỳ connection nào. Permission cho loại global là dành cho mọi người (public) và không thể thay đổi. Loại stored procedure được tạo trực tiếp trên TempDB khác với 2 loại trên ở chỗ ta có thể set permission, chúng tồn tại kể cả sau khi connection tạo ra chúng bị cắt đứt và chỉ biến mất khi SQL Server shut down.
    1. Extended Stored Procedure : Ðây là một loại stored procedure sử dụng một chương trình ngoại vi (external program) vốn được compiled thành một DLL để mở rộng chức năng hoạt động của SQL Server. Loại này thường bắt đầu bằng tiếp đầu ngữ xp_ .Ví dụ,xp_sendmaildùng đề gởi mail cho một người nào đó hayxp_cmdshelldùng để chạy một DOS command… Ví dụxp_cmdshell ‘dir c:\’ .Nhiều loại extend stored procedure được xem như system stored procedure và ngược lại.
  • Remote Stored Procedure : Những stored procedure gọi stored procedure ở server khác.

Viết Stored Procedure

Tên và những thông tin về Stored Procedure khi được tạo ra sẽ chứa trong SysObjects table còn phần text của nó chứa trong SysComments table. Vì Stored Procedure cũng được xem như một object nên ta cũng có thể dùng các lệnh như CREATE, ALTER, DROP để tạo mới, thay đổi hay xóa bỏ một stored procedure. Chúng ta hãy xem một ví dụ sau về Stored Procedure: Ðể tạo một stored procedure bạn có thể dùng Enterprise Manager click lên trên Stored Procedure -> New Stored Procedure…. Trong ví dụ này ta sẽ tạo ra một stored procedure để insert một new order vào Orders table trong Practice DB. Ðể insert một order vào database ta cần đưa vào một số input như OrderID, ProductName (order món hàng nào) và CustomerName (ai order). Sau đó ta trả về kết quả cho biết việc insert đó có thành công hay không. Result = 0 là insert thành công.


	CREATE PROCEDURE AddNewOrder 
	@OrderID smallint,
	@ProductName varchar(50),
	@CustomerName varchar(50),
	@Result smallint=1 Output
	AS

	DECLARE @CustomerID smallint
	BEGIN TRANSACTION
	If not Exists(SELECT CustomerID FROM Customers WHERE [Name]=@CustomerName)
	--This is a new customer. Insert this customer to the database
		BEGIN
			SET @CustomerID= (SELECT Max(CustomerID) FROM Customers)
			SET @CustomerID=@CustomerID+1
			INSERT INTO Customers VALUES(@CustomerID,@CustomerName)
			If Exists(SELECT OrderID FROM [Orders] WHERE OrderID=@OrderID)
			--This order exists and could not be added any more so Roll back
				BEGIN
					SELECT @Result=1
					ROLLBACK TRANSACTION
				END
			Else
			--This is a new order insert it now
				BEGIN
					INSERT INTO [Orders](OrderID,ProductName,CustomerID) VALUES(@OrderID,@ProductName,@CustomerID)
					SELECT @Result=0
					COMMIT TRANSACTION
				END
		END
	Else
	--The customer exists in DB go ahead and insert the order
		BEGIN
			If Exists(SELECT OrderID FROM [Orders] WHERE OrderID=@OrderID)
			--This order exists and could not be added any more so Roll back
				BEGIN
					SELECT @Result=1
					ROLLBACK TRANSACTION
				END
			Else
			--This is a new order insert it now
				BEGIN
					INSERT INTO [Orders](OrderID,ProductName,CustomerID) VALUES(@OrderID,@ProductName,@CustomerID)
					SELECT @Result=0
					COMMIT TRANSACTION
				END
		END
	Print @Result
	Return

Ðể tạo ra một stored procedure ta dùng lệnh CREATE PROCEDURE theo sau là tên của nó (nếu là stored procedure tạm thời thì thêm dấu # trước tên của procedure. Nếu muốn encrypt thì dùng WITH ENCRYPTION trước chữ AS) và các biến input hoặc ouput (parameters). Nếu là output thì thêm keyword OUTPUT đằng sau parameter. Ta có thể cho giá trị default cùng lúc với khai báo data type của parameter. Kể từ sau chữ AS là phần body của stored procedure.

Trong ví dụ ở trên trước hết ta khai báo một biến @CustomerID sau đó bắt đầu một transaction bằng BEGIN TRANSACTION (toàn bộ công việc insert này được thực hiện trong một Transaction nghĩa là hoặc là insert thành công hoặc là không làm gì cả – all or nothing). Trước hết ta kiểm tra xem người khách hàng là người mới hay cũ. Nếu là người mới thì ta “tiện tay” insert vào bảng Customers luôn còn nếu không thì chỉ insert vào bảng Orders mà thôi. Nếu là người customer mới ta lấy CustomerID lớn nhất từ bảng Customers bỏ vào biến @CustomerID và sau đó tăng lên một đơn vị dùng cho việc Insert Customer ở dòng kế tiếp.
Sau khi insert khách hàng mới mới ta tiếp tục công việc bằng việc kiểm tra xem Order muốn insert đã tồn tại chưa (vì nếu order đã tồn tại thì khi insert SQL Server sẽ báo lỗi do OrderID là Primary key). Nếu như order trên vì lý do nào đó đã có trong DB thì ta roll back và trả kết quả =1 còn nếu không thì ta insert một order mới vào và commit transaction với kết quả trả về =0.
Tương tự như vậy nếu khách hàng đã tồn tại (sau chữ else đầu tiên) thì ta chỉ việc insert order giống như trên. Trong mọi trường hợp kể trên ta đều in ra kết quả và return.
Ví dụ trên đây chỉ mang tính học hỏi còn trên thực tế database có thể phức tạp hơn nhiều nên việc viết stored procedure đòi hỏi kiến thức vững chắc về SQL và kỹ năng về lập trình.
Muốn hiểu rõ hơn về bài học này bạn cần làm bài tập số 2.


Kết luận

Trong bài này chúng ta đã tìm hiểu một số kỹ thuật import và export dữ liệu . Ðồng thời biết qua các cách select dữ liệu từ các hệ thống cơ sở dữ liệu khác dùng truy vấn phân tán (distributed query). Nhưng quan trọng nhất và thường dùng nhất là các stored procedure. Bạn cần hiểu rõ vai trò của stored procedure và biết cách tạo ra chúng.
Vì kiến thức về database nói chung và SQL Server nói riêng khá rộng nên trong khuôn khổ một bài học chúng tôi không thể trình bày cặn kẽ từng chi tiết và đôi khi có hơi dồn ép cho nên bạn cần đọc đi đọc lại nhiều lần để nắm được ý chính và phải xem thêm sách (nếu không có sách thì phải xem thêm SQL Books Online). Sau bài học này các bạn cần làm bài tập số 2 để hệ thống hóa lại kiến thức đã học. Khi làm bài tập nên làm theo thứ tự và tuân thủ theo các yêu cầu của bài tập đặt ra. Không nên bỏ qua bước nào.


Tham khảo

Có thể bạn sẽ thích…

2 phản hồi

  1. Mr.D viết:

    xin chào, mình có tình huống sử dụng stored procedure thế này
    B1, tạo stored procedure SP_1
    B2, tạo stored procedure SP_2, trong đó gọi lại SP_1
    B3, chạy SP_1 ==> ok ra kết quả
    B4, chạy SP_2 ==> ok ra kết quả
    B5, compile lại SP_1
    B6, chạy SP_2 ==> lỗi ????? chỗ này không hiểu tại sao

    có cách nào để lúc chạy bước B6 mà không bị lỗi hay không ? (bỏ qua B3)

Để lại một bình luận