Bài 17: Lập trình với Chuỗi trong C


Mục tiêu

Kết thúc bài học này, bạn có thể:

  • Giải thích các biến và hằng kiểu chuỗi
  • Giải thích con trỏ trỏ đến chuỗi
  • Thực hiện các thao tác nhập/xuất chuỗi
  • Giải thích các hàm thao tác chuỗi
  • Giải thích cách thức truyền mảng vào hàm như tham số
  • Mô tả cách thức sử dụng chuỗi như các tham số của hàm.

Giới thiệu

Các chuỗi trong C được cài đặt như là các mảng ký tự kết thúc bởi ký tự NULL (‘\0’). Bài này sẽ thảo luận về công dụng và thao tác trên chuỗi.


17.1  Các biến và hằng kiểu chuỗi

Các biến chuỗi được sử dụng để lưu trữ một chuỗi các ký tự. Như các biến khác, các biến này phải được khai báo trước khi sử dụng. Ví dụ khai báo một biến chuỗi:


char str[10];

str là một mảng các ký tự có thể lưu tối đa 10 ký tự. Giả sử str được gán một hằng chuỗi,

“WELL DONE”

Một hằng chuỗi là một dãy các ký tự nằm trong dấu nháy kép. Mỗi ký tự trong một chuỗi được lưu trữ như là một phần tử của mảng. Trong bộ nhớ, chuỗi được lưu trữ như sau:

‘W’ ‘E’ ‘L’ ‘L’ ‘ ’ ‘D’ ‘O’ ‘N’ ‘E’ ‘\0’

Ký tự ‘\0’ (null) được tự động thêm vào trong cách biểu diễn bên trong của chuỗi để đánh dấu điểm kết thúc chuỗi. Vì vậy, khi khai báo một chuỗi, phải tăng kích thước của nó thêm một phần tử để chứa kí hiệu kết thúc null.

17.1.1 Con trỏ trỏ đến chuỗi

Chuỗi có thể được lưu và truy cập bằng cách sử dụng con trỏ kiểu ký tự. Một con trỏ kiểu ký tự trỏ đến một chuỗi được khai báo như sau:


char *pstr = “WELCOME”;

pstr là một con trỏ được khởi tạo để trỏ đến một hằng chuỗi. Con trỏ pstr có thể thay đổi để trỏ đến bất kì một chuỗi nào khác Mặc dù khi con trỏ pstr trỏ đến một chuỗi khác thì ta không thể truy xuất đến chuỗi “WELCOME”được nữa.

17.1.2 Các thao tác nhập xuất chuỗi

Các thao tác nhập/xuất (I/O) chuỗi trong C được thực hiện bằng cách gọi các hàm. Các hàm này là một phần của thư viện nhập/xuất chuẩn tên stdio.h. Một chương trình muốn sử dụng các hàm nhập/xuất chuỗi phải có câu lệnh khai báo sau ở đầu chương trình:


#include <stdio.h>

Khi chương trình có chứa câu lệnh này được biên dịch, thì nội dung của tập tin stdio.h sẽ trở thành một phần của chương trình.

  • Các thao tác nhập/xuất chuỗi đơn giản

Sử dụng hàm gets() là cách đơn giản nhất để nhập một chuỗi thông qua thiết bị nhập chuẩn. Các ký tự sẽ được nhập vào cho đến khi nhấn phím Enter. Hàm gets() thay thế ký tự kết thúc trở về đầu dòng ‘\n’ bằng ký tự ‘\0’. Cú pháp hàm này như sau:


gets(str);

Trong đó str là một mảng ký tự đã được khai báo.

Tương tự, hàm puts() được sử dụng để hiển thị một chuỗi ra thiết bị xuất chuẩn. Ký tự xuống dòng sẽ kết thúc việc xuất chuỗi. Cú pháp hàm như sau:


puts(str);

Trong đó str là một mảng ký tự đã được khai báo và khởi tạo. Chương trình sau đây nhận vào một tên và hiển thị một thông báo.

Ví dụ 1:


#include <stdio.h>

void main()
{
    char name[20];
    /*   name is declared as a single dimensional character
    array */
    clrscr();                  /* Clears the screen */
    puts("Enter your name:");  /* Displays a message */
    gets(name);                /* Accepts the input */
    puts("Hi there: ");
    puts(name);                /* Displays the input */
    getch();
}

Nếu tên Lisa được nhập vào, chương trình trên cho ra kết quả:

Enter your name:
Lisa
Hi there:
Lisa
  • Các thao tác Nhập/Xuất chuỗi có định dạng

Có thể sử đụng các hàm scanf()printf() để nhập và hiển thị các giá trị chuỗi. Các hàm này được dùng để nhập và hiển thị các kiểu dữ liệu hỗn hợp trong một câu lệnh duy nhất. Cú pháp để nhập một chuỗi như sau:


scanf(“%s”, str);

Trong đó ký hiệu định dạng %s cho biết rằng một giá trị chuỗi sẽ được nhập vào. str là một mảng ký tự đã được khai báo. Tương tự, để hiển thị chuỗi, cú pháp sẽ là:


printf(“%s”, str);

Trong đó ký hiệu định dạng %s cho biết rằng một giá trị chuỗi sẽ được hiển thị và str là một mảng ký tự đã được khai báo và khởi tạo.Hàm printf() có thể dùng để hiển thị ra các thông báo mà không cần kí tự định dạng.

Có thể sửa đổi chương trình bên trên để nhập vào và hiển thị một tên, sử dụng hàm scanf() và printf().

Ví dụ 2:


#include <stdio.h>

void main()
{
    char name[20];
    /*   name is declared as a single dimensional character
    array */
    clrscr();                       /* Clears the screen */
    printf("Enter your name: ");    /* Displays a message */
    scanf(“%s”, name);              /* Accepts the input */
    printf("Hi there: %s", name);   /* Displays the input */
    getch();
}

Nếu nhập vào tên Brendan , chương trình trên cho ra kết quả:

Enter your name: Brendan
Hi there: Brendan

17.2  Các hàm về chuỗi

C hỗ trợ rất nhiều hàm về chuỗi. Các hàm này có thể tìm thấy trong tập tin string.h. Một số thao tác mà các hàm này thực hiện là:

  • Nối chuỗi
  • So sánh chuỗi
  • Định vị một ký tự trong chuỗi
  • Sao chép một chuỗi sang chuỗi khác
  • Xác định chiều dài của chuỗi.

17.2.1 Hàm strcat()

Hàm strcat() được sử dụng để nối hai chuỗi vào nhau. Cú pháp hàm là:


strcat(str1, str2);

trong đó str1str2 là hai chuỗi đã được khai báo và khởi tạo. Hàm này sẽ thực hiện nối chuỗi  str2 vào sau chuỗi str1

Chương trình sau đây nhận vào họ và tên,nối chúng với nhau và hiển thị ra họ tên đầy đủ.

Ví dụ 3:


#include<stdio.h>
#include<string.h>

void  main()
{
    char firstname[15];
    char lastname[15];

    clrscr();
    printf("Enter your first name: ");
    scanf("%s", firstname);
    printf("Enter your last name:");
    scanf("%s", lastname);
    strcat(firstname, lastname);
    /* Attaches the contents of lastname at the end of firstname */
    printf("%s", firstname);
    getch();
}

Kết quả của chương trình trên được minh họa như sau:

Enter your first name: Carla
Enter your last name: Johnson
CarlaJohnson

17.2.2 Hàm strcmp()

Việc so sánh hai số (bằng nhau hay không bằng nhau) có thể thực hiện bằng cách sử dụng các toán tử quan hệ. Tuy nhiên, để so sánh hai chuỗi kí tự, phải dùng một hàm. Hàm strcmp() so sánh hai chuỗi với nhau và trả về một số nguyên phụ thuộc vào kết quả so sánh. Cú pháp của hàm strcmp() như sau:


strcmp(str1, str2);

trong đó str1str2 là hai chuỗi đã được khai báo và khởi tạo.Hàm trả về giá trị:

  • Nhỏ hơn 0 nếu str1<str2
  • 0 nếu str1 = str2
  • Lớn hơn 0 nếu str1>str2

Chương trình sau đây so sánh biến name1 với các biến name2, name3, name4 và hiển thị kết quả của phép so sánh:

Ví dụ 4:


#include <stdio.h>
#include<string.h>

void  main()
{
    char name1[15] = "Geena";
    char name2[15] = "Dorothy";
    char name3[15] = "Shania";
    char name4[15] = "Geena";
    int i;
    clrscr();
    i = strcmp(name1,name2);
    printf("%s compared with %s returned %d\n", name1, name2, i);
    i=strcmp(name1, name3);
    printf("%s compared with %s returned %d\n", name1, name3, i);
    i=strcmp(name1,name4);
    printf("%s compared with %s returned %d\n", name1, name4, i);
    getch();
}

Kết quả của chương trình trên được minh họa như sau:

Geena compared with Dorothy returned 3
Geena compared with Shania returned -12
Geena compared with Geena returned 0

Lưu ý giá trị trả về trong mỗi phép so sánh ở ví dụ trên. Đó là sự khác nhau về mã ASCII của hai kí tự khác nhau đầu tiên tìm thấy trong hai chuỗi.

17.2.3 Hàm strchr()

Hàm strchr() xác định vị trí xuất hiện của một ký tự trong một chuỗi. Cú pháp hàm là:


strchr(str, chr);

trong đó str là một mảng ký tự hay chuỗi. chr là một biến ký tự chứa giá trị cần tìm. Hàm trả về con trỏ trỏ đến giá trị tìm được đầu tiên trong chuỗi, hoặc NULL nếu không tìm thấy.

Chương trình sau đây xác định liệu ký tự ‘a’ có xuất hiện trong tên hai thành phố hay không.

Ví dụ 5:


#include <stdio.h>
#include<string.h>

void  main()
{
    char str1[15] = "New York";
    char str2[15] = "Washington";
    char chr = 'a', *loc;

    clrscr();
    loc = strchr(str1, chr);
    /* Checks for the occurrence of the character value held by chr in the first city name */

    if(loc != NULL)
        printf("%c occurs in %s\n", chr, str1);
    else
        printf("%c does not occur in %s\n", chr, str1);

    loc = strchr(str2, chr);
    /* Checks for the occurrence of the character in the second city name */
    if(loc != NULL)
        printf("%c occurs in %s\n", chr, str2);
    else
        printf("%c does not occur in %s\n", chr, str2);

    getch();
}

Kết quả của chương trình trên được minh họa như sau:

a does not occur in New York
a occurs in Washington

17.2.4 Hàm strcpy()

Trong C không có toán tử nào xử lý một chuỗi như là một đơn vị duy nhất. Vì vậy, phép gán một giá trị chuỗi này cho một chuỗi khác đòi hỏi phải sử dụng hàm strcpy(). Cú pháp hàm là:

strcpy(str1, str2);

trong đó str1str2 là hai mảng ký tự đã được khai báo và khởi tạo. Hàm sao chép giá trị str2 vào str1 và trả về  chuỗi str1.

Chương trình sau đây minh họa việc sử dụng hàm strcpy(). Nó thay đổi tên của một khách sạn và hiển thị tên mới.

Ví dụ 6:


#include <stdio.h>
#include<string.h>

void  main()
{
    char hotelname1[15] = "Sea View";
    char hotelname2[15] = "Sea Breeze";

    clrscr();
    printf("The old name is %s\n", hotelname1);
    strcpy(hotelname1, hotelname2);
    /*Changes the hotel name*/
    printf("The new name is %s\n", hotelname1);
    /*Displays the new name*/
    getch();
}

Kết quả của chương trình trên được minh họa như sau:

The old name is Sea View
The new name is Sea Breeze

17.2.5 Hàm strlen()

Hàm strlen() trả về chiều dài của chuỗi. Chiều dài của chuỗi rất hay được sử dụng trong các vòng lặp truy câp từng kí tự của chuỗi. Cú pháp của hàm là:


strlen(str);

trong đó str là mảng ký tự đã được khai báo và khởi tạo. Hàm trả về chiều dài của chuỗi str.

Chương trình sau đây đưa ra ví dụ đơn giản sử dụng hàm strlen(). Nó tìm chiều dài của tên một công ty và hiển thị tên công ty đó với các ký tự được phân cách nhau bởi ký tự ‘*’.

Ví dụ 7:


#include<stdio.h>
#include<string.h>

void  main()
{
    char compname[20] = "Microsoft";
    int len, ctr;

    clrscr();
    len = strlen(compname);
    /* Determines the length of the string */
    for(ctr = 0; ctr < len; ctr++)
    /* Accesses and displays each character of the string*/
    printf("%c * ", compname[ctr]);
}

Kết quả của chương trình trên được minh họa như sau:

M * i * c * r * o * s * o * f * t *

17.3 Truyền mảng vào hàm

Trong C, khi một mảng được truyền vào hàm như một tham số, thì chỉ có địa chỉ của mảng được truyền vào. Tên mảng không kèm theo chỉ số là địa chỉ của mảng. Đoạn mã dưới đây mô tả cách truyền địa chỉ của mảng ary cho hàm fn_ary():


void main()
{
    int ary[10];
    .
    .
fn_ary(ary);
    .
    .
}

Nếu tham số của hàm là một mảng một chiều thì tham số đó có thể được khai báo theo một trong các cách sau:


fn_ary (int ary [10])    /* sized array */
{
    :
}

hoặc


fn_arry (int ary [])     /*unsized array */
{
    :
}

Cả hai khai báo ở trên đều cho cùng kết quả. Kiểu thứ nhất sử dụng cách khai báo mảng chuẩn, chỉ rõ ra kích thước của mảng. Kiểu thứ hai, chỉ ra rằng tham số là một mảng kiểu int có kích thước bất kì.

Chương trình sau đây nhận các số vào một mảng số nguyên. Sau đó mảng này sẽ được truyền vào hàm sum_arr(). Hàm sẽ tính toán và trả về tổng của các số nguyên trong mảng.

Ví dụ 8:


#include <stdio.h>

void  main()
{
    int num[5], ctr, sum = 0;
    int sum_arr(int num_arr[]); /* Function declaration */

    clrscr();

    for(ctr = 0; ctr < 5; ctr++) /*Accepts numbers into the array*/
    {
        printf("\nEnter number %d: ", ctr+1);
        scanf("%d", &num[ctr]);
    }

    sum = sum_arr(num); /* Invokes the function */
    printf("\nThe sum of the array is %d", sum);
    getch();
}

int sum_arr(int num_arr[]) /* Function definition */
{
     int i, total;
     for(i = 0, total = 0; i < 5; i++) /* Calculates the sum */
     total += num_arr[i];
     return total; /* Returns the sum to main() */
}

Kết quả của chương trình trên được minh họa như sau:

Enter number 1: 5
Enter number 2: 10
Enter number 3: 13
Enter number 4: 26
Enter number 5: 21
The sum of the array is 75

17.4  Truyền chuỗi vào hàm

Chuỗi, hay mảng ký tự, có thể được truyền vào hàm. Ví dụ, chương trình sau đây sẽ nhận vào các chuỗi và lưu trong một mảng ký tự hai chiều. Sau đó, mảng này sẽ được truyền vào trong một hàm dùng để tìm chuỗi dài nhất trong mảng đó.

Ví dụ 9:


#include <stdio.h>

void  main()
{
    char lines[5][20];
    int ctr, longctr = 0;
    int longest(char lines_arr[][20]);
    /* Function declaration */
    clrscr();

    for(ctr = 0; ctr < 5; ctr++)
    /* Accepts string values into the array */
    {
       printf("\nEnter string %d: ", ctr + 1);
       scanf("%s", lines[ctr]);
    }
    longctr = longest(lines);

    /* Passes the array to the function */
    printf("\nThe longest string is %s", lines[longctr]);
    getch();
}

int longest(char lines_arr[][20]) /* Function definition */
{
    int i = 0, l_ctr = 0, prev_len, new_len;
    prev_len = strlen(lines_arr[i]);

   /* Determines the length of the first element */
   for(i++; i < 5; i++)
      {
         new_len = strlen(lines_arr[i]);
        /* Determines the length of the next element */
        if(new_len > prev_len)
        l_ctr = i;
        /* Stores the subscript of the longer string */
        prev_len = new_len;
      }
   return l_ctr;
   /* Returns the subscript of the longest string */
}

Kết quả của chương trình trên được minh họa như sau:

Enter string 1: The
Enter string 2: Sigma
Enter string 3: Protocol
Enter string 4: Robert
Enter string 5: Ludlum
The longest string is Protocol

Tóm tắt bài học

  • Chuỗi trong C được cài đặt như mảng các ký tự kết thúc bằng ký tự NULL (‘\0’).
  • Các biến chuỗi được sử dụng để lưu một dãy các ký tự.
  • Một hằng chuỗi là một dãy các ký tự bao bởi dấu nháy kép.
  • Các chuỗi có thể được lưu trữ và truy cập bằng cách sử dụng các con trỏ ký tự.
  • Các thao thác nhập/xuất chuỗi trong C được thực hiện bằng các hàm thuộc thư viện nhập/xuất chuẩn h.
  • Hàm gets()puts() là cách đơn giản nhất để nhập vào và hiển thị chuỗi.
  • Hàm scanf()printf() có thể được sử dụng để nhập vào và hiển thị chuỗi cùng với các kiểu dữ liệu khác.
  • C hỗ trợ rất nhiều hàm về chuỗi, mà chúng ta có thể tìm thấy trong thư viện chuẩn h.
  • Hàm strcat() được sử dụng để nối hai chuỗi vào một.
  • Hàm strcmp() so sánh hai chuỗi và trả về một số nguyên dựa vào kết quả của phép so sánh.
  • Hàm strchr() xác định vị trí xuất hiện của một ký tự trong một chuỗi.
  • Hàm strcpy() sao chép nội dung của một chuỗi vào một chuỗi khác.
  • Hàm strlen() trả về độ dài của chuỗi.
  • Trong C, khi một mảng được truyền vào hàm như một tham số, chỉ có địa chỉ của mảng được truyền vào.
  • Tên mảng không đi kèm với chỉ số là địa chỉ của mảng.

Kiểm tra tiến độ học tập

  1. Các chuỗi được kết thúc bởi ký tự __null________.
  1. Số lượng ký tự có thể nhập vào char_arr[15] là _14________.
  1. Sự thay đổi giá trị của con trỏ kiểu chuỗi có thể dẫn đến mất dữ liệu. (Đúng / Sai)
  1. Ký tự _\n_ được sử dụng để sang dòng mới trong printf().
  1. Để sử dụng hàm strcat(), tập tin header ________ phải được bao gồm trong chương trình.
  1. Hai con trỏ có thể so sánh được chỉ khi cả hai biến đang trỏ đến các biến có kiểu khác nhau.

(Đúng / Sai)

  1. strcmp() trả về _______ nếu hai chuỗi hoàn toàn giống nhau.
  1. Khi một mảng được truyền vào một hàm, chỉ có __dia chi_____ của nó được truyền.

Bài tập tự làm

  1. Viết một chương trình để nhập vào hai chuỗi. Chương trình sẽ xác định liệu chuỗi thứ nhất có xuất hiện ở cuối chuỗi thứ hai không.
  1. Viết một chương trình nhập vào một mảng các số và hiển thị giá trị trung bình. Sử dụng hàm để tính giá trị trung bình.

Có thể bạn sẽ thích…

Trả lời