Tìm Hiểu Kiến Thức Nghiệp Vụ Chấm Điểm Tín Dụng Trong Kỷ Nguyên Số

A

22 min read • 45 day ago

Views:Unavailable

Giới thiệu

Trong bối cảnh ngân hàng số và sự phát triển mạnh mẽ của công nghệ dữ liệu, chấm điểm tín dụng (Credit Scoring) đã trở thành một trong những nghiệp vụ cốt lõi, quyết định khả năng cạnh tranh của tổ chức tài chính. Nếu như trước đây, việc đánh giá tín dụng chủ yếu dựa vào dữ liệu hạn chế từ CIC (Trung tâm Thông tin Tín dụng Quốc gia) và hồ sơ giấy tờ truyền thống, thì nay ngân hàng có thể khai thác dữ liệu đa dạng, mô hình ML/AI và kỹ thuật phân tích nâng cao để đưa ra quyết định nhanh chóng, chính xác và công bằng hơn.

Nghiệp vụ chấm điểm tín dụng trong ngân hàng

Vai trò chiến lược của Credit Scoring

Ra quyết định cốt lõi

Hầu hết các khoản vay cá nhân và SME (doanh nghiệp nhỏ và vừa) đều dựa vào điểm tín dụng để quyết định phê duyệt hay từ chối. Đây là bước sàng lọc ban đầu giúp ngân hàng giảm thiểu rủi ro ngay trước khi giải ngân.

Quản trị rủi ro tập trung

Credit Scoring là công cụ giúp ngân hàng duy trì tỷ lệ nợ xấu (NPL – Non-performing Loan) ở mức an toàn. Nợ xấu là các khoản vay quá hạn trả lãi hoặc gốc trên 90 ngày, hoặc có khả năng mất vốn. Nếu tỷ lệ nợ xấu vượt ngưỡng, ngân hàng sẽ bị giảm lợi nhuận, ảnh hưởng uy tín và có thể bị cơ quan quản lý can thiệp.

Chiến lược khách hàng theo rủi ro

Dựa trên điểm tín dụng, khách hàng được phân thành nhiều nhóm rủi ro khác nhau (thấp, trung bình, cao). Điều này giúp ngân hàng xây dựng chính sách phù hợp: khách hàng rủi ro thấp được hưởng lãi suất ưu đãi và hạn mức cao; trong khi nhóm rủi ro cao chỉ được cấp tín dụng hạn chế tức là hạn mức vay thấp hơn, thời hạn ngắn hơn, kèm yêu cầu bổ sung tài sản bảo đảm hoặc đồng bảo lãnh. Tín dụng hạn chế giúp ngân hàng giảm thiểu thiệt hại tiềm ẩn nhưng vẫn duy trì quan hệ với khách hàng có rủi ro cao thay vì từ chối hoàn toàn..

Tuân thủ pháp lý

Các chuẩn trong nước và quốc tế đều yêu cầu ngân hàng có hệ thống đo lường rủi ro minh bạch:

  • Basel II/III: yêu cầu đo lường và quản lý xác suất vỡ nợ (PD), tổn thất kỳ vọng (LGD, EAD) để tính vốn tự có tối thiểu.

  • IFRS 9: bắt buộc trích lập dự phòng tổn thất dựa trên tổn thất tín dụng kỳ vọng (ECL), đòi hỏi mô hình Credit Scoring phải có khả năng dự báo sớm.

  • Ngân hàng Nhà nước: quy định phân loại nợ và trích lập dự phòng rủi ro tín dụng. Điểm tín dụng là cơ sở quan trọng để đảm bảo tuân thủ và báo cáo minh bạch.

  • Tăng cường cạnh tranh: Với Credit Scoring hiện đại, quyết định tín dụng có thể được đưa ra chỉ trong vài phút thay vì vài ngày. Điều này vừa cải thiện trải nghiệm khách hàng, vừa giúp ngân hàng có lợi thế cạnh tranh trên thị trường tài chính số.

Quy trình nghiệp vụ truyền thống

Trong các ngân hàng trước đây, quy trình chấm điểm tín dụng thường được triển khai theo các bước sau:

Thu thập thông tin

  • Hồ sơ giấy tờ: khách hàng phải cung cấp CMND/CCCD, sổ hộ khẩu, hợp đồng lao động, giấy đăng ký kinh doanh (nếu là doanh nghiệp).
  • Thông tin CIC (Trung tâm Thông tin Tín dụng Quốc gia): ngân hàng truy vấn dữ liệu từ CIC, bao gồm lịch sử vay nợ, tình trạng trả nợ, các khoản nợ xấu, số lượng khoản vay đang tồn tại tại các tổ chức tín dụng khác.
  • Báo cáo tài chính (đối với SME/doanh nghiệp): bộ báo cáo gồm bảng cân đối kế toán, báo cáo kết quả kinh doanh.. Những số liệu này thường do doanh nghiệp tự lập và có thể chưa được kiểm toán, dẫn tới độ tin cậy không đồng đều.

Chấm điểm tín dụng thủ công / bán tự động

  • Thủ công: cán bộ tín dụng sử dụng biểu mẫu tính điểm, cộng/trừ điểm dựa trên quy định sẵn, sau đó tự đánh giá thêm bằng kinh nghiệm cá nhân.

  • Bán tự động (truyền thống hiện đại hơn): Bắt đầu ứng dụng các mô hình thống kê trong chấm điểm tín dụng. Các mô hình phổ biến gồm:

    • Logistic Regression: ước lượng xác suất khách hàng vỡ nợ dựa trên các biến số như thu. nhập, lịch sử trả nợ, tỷ lệ nợ/thu nhập.
    • Z-score: một mô hình do Altman đề xuất, ban đầu dùng để dự báo phá sản doanh nghiệp, sau đó mở rộng cho cá nhân/SME. Điểm Z càng thấp thì rủi ro vỡ nợ càng cao.
    • Hệ số chấm điểm (Scorecard Coefficient): dựa trên việc gán trọng số (hệ số) cho từng biến đầu vào. Ví dụ: mỗi năm lịch sử tín dụng tốt = +15 điểm, mỗi lần trễ hạn = -25 điểm.
  • Đặc điểm chung: quy trình phụ thuộc nhiều vào đánh giá chủ quan (qualitative judgment) của nhân sự, dễ dẫn đến thiếu nhất quán.

Ra quyết định tín dụng

  • Nếu điểm cao: phê duyệt vay, áp dụng lãi suất thấp.
  • Nếu điểm trung bình: yêu cầu bổ sung tài sản đảm bảo hoặc đồng bảo lãnh.
  • Nếu điểm thấp: từ chối khoản vay.
  • Điểm dựa vào các mô hình phổ biến ví dụ như Z-score hay hệ số chấm điểm trình bày ở trên,... Bên cạnh đó, mỗi ngân hàng thì sẽ có cách tính và ngưỡng đánh giá thang điểm khác nhau.

Theo dõi sau giải ngân

  • Giám sát tình hình trả nợ định kỳ: Ngân hàng thiết lập lịch theo dõi dựa trên kỳ hạn trả nợ (hàng tháng, hàng quý). Hệ thống sẽ tự động đối chiếu số tiền khách hàng trả với số tiền đến hạn trong hợp đồng. Nếu khách hàng trả thiếu hoặc trễ, cảnh báo sẽ được kích hoạt.
  • Phát hiện sớm dấu hiệu rủi ro: Bao gồm các hành vi như trả chậm nhiều kỳ, chỉ trả một phần lãi mà không trả gốc, hoặc có xu hướng ngày càng chậm trễ. Đây là những tín hiệu sớm để ngân hàng đánh giá lại khả năng trả nợ.
  • Cập nhật điểm tín dụng theo chu kỳ: Điểm tín dụng không cố định sau khi phê duyệt. Thay vào đó, nó được điều chỉnh định kỳ (ví dụ 3 tháng/lần hoặc 6 tháng/lần) dựa trên lịch sử trả nợ mới. Khách hàng trả đúng hạn liên tục sẽ được nâng hạng, ngược lại nếu trễ hạn nhiều lần thì điểm tín dụng sẽ bị hạ thấp, dẫn đến hạn chế tiếp cận tín dụng mới.

Điểm yếu của mô hình truyền thống

  • Phụ thuộc quá nặng vào dữ liệu CIC, trong khi chưa khai thác dữ liệu thay thế (ví điện tử, thương mại điện tử, viễn thông...).
  • Quy trình phê duyệt thủ công/bán tự động mất nhiều ngày, không đáp ứng yêu cầu giải ngân nhanh.
  • Rủi ro thiên vị và thiếu công bằng do yếu tố con người (subjective bias).
  • Khó phù hợp với mô hình ngân hàng số, nơi khách hàng kỳ vọng giải ngân trong vài phút thay vì nhiều ngày.

Các mục tiêu nghiệp vụ cốt lõi

Chấm điểm tín dụng không chỉ dừng lại ở việc trả lời câu hỏi “cho vay hay không”, mà còn đóng vai trò quan trọng trong quản trị rủi ro và xây dựng chiến lược kinh doanh của ngân hàng. Các mục tiêu chính gồm:

PD (Probability of Default – Xác suất vỡ nợ):

Ước tính khả năng khách hàng không trả được nợ đúng hạn trong một khoảng thời gian nhất định. Ví dụ: một khách hàng có PD = 5% nghĩa là trong 100 trường hợp tương tự, 5 khách hàng có khả năng rơi vào tình trạng vỡ nợ.

LGD (Loss Given Default – Tỷ lệ tổn thất khi vỡ nợ):

  • Cho biết ngân hàng sẽ thiệt hại bao nhiêu phần trăm khi khách hàng không trả được nợ, sau khi đã xử lý tài sản đảm bảo.
  • Tài sản đảm bảo là những tài sản mà khách hàng dùng để thế chấp hoặc cầm cố cho khoản vay, ví dụ: bất động sản, xe ô tô, sổ tiết kiệm. Nếu khách hàng vỡ nợ, ngân hàng có quyền xử lý tài sản này để thu hồi một phần vốn.
  • Ví dụ: khách hàng vay 1 tỷ đồng, có thế chấp căn hộ trị giá 800 triệu. Khi khách hàng vỡ nợ, ngân hàng chỉ thu hồi được 600 triệu từ tài sản đảm bảo. Khi đó LGD = (1 tỷ – 600 triệu) / 1 tỷ = 40%.

EAD (Exposure at Default – Dư nợ tại thời điểm vỡ nợ):

  • Thể hiện tổng số tiền khách hàng còn nợ ngân hàng khi vỡ nợ.
  • Dư nợ chính là phần tiền gốc và lãi vay mà khách hàng chưa trả tính đến thời điểm hiện tại.
  • Ví dụ: khách hàng được cấp hạn mức thẻ tín dụng 200 triệu nhưng mới sử dụng 120 triệu. Nếu vỡ nợ tại thời điểm này, EAD = 120 triệu.

Expected Loss (EL – Tổn thất kỳ vọng):

Công thức tính: EL = PD × LGD × EAD Đây là cơ sở quan trọng để ngân hàng trích lập dự phòng rủi ro.

  • Trích lập dự phòng nghĩa là ngân hàng phải dành ra một khoản chi phí dự phòng từ lợi nhuận để bù đắp cho những khoản vay có khả năng trở thành nợ xấu. Đây là yêu cầu bắt buộc theo quy định của NHNN và các chuẩn quốc tế (như IFRS9).
  • Risk-based Pricing (Định giá theo rủi ro): Thay vì áp dụng một mức lãi suất chung cho tất cả khách hàng, ngân hàng xác định lãi suất phù hợp dựa trên mức độ rủi ro từng khách hàng.
  • Ví dụ: Khách hàng A có lịch sử tín dụng tốt, thu nhập ổn định, PD thấp → được hưởng lãi suất 8%/năm. Khách hàng B có thu nhập bấp bênh, CIC ghi nhận từng trễ hạn nhiều lần thì lãi suất 12%/năm để bù đắp rủi ro cao hơn.

Thách thức nghiệp vụ

Trong thực tiễn triển khai chấm điểm tín dụng, ngân hàng thường gặp nhiều khó khăn:

Dữ liệu hạn chế:

Nhiều khách hàng chưa từng vay vốn nên không có lịch sử tín dụng tại CIC (Trung tâm Thông tin Tín dụng Quốc gia). Việc thiếu dữ liệu quá khứ khiến ngân hàng khó ước lượng chính xác mức độ rủi ro.

Khách hàng tiềm ẩn rủi ro cao:

  • Một nhóm lớn khách hàng thuộc diện thu nhập không ổn định, làm nghề tự do hoặc kinh doanh cá thể.
  • Kinh doanh cá thể là hình thức kinh doanh do một cá nhân hoặc hộ gia đình tự đứng tên, không có tư cách pháp nhân như doanh nghiệp. Loại hình này thường khó chứng minh dòng tiền ổn định, sổ sách tài chính ít minh bạch, dẫn đến rủi ro cao hơn khi vay vốn.

Thiếu minh bạch:

Các mô hình truyền thống như logistic regression thường cho ra kết quả chấm điểm dưới dạng một con số nhưng không lý giải rõ ràng vì sao khách hàng bị từ chối hay được phê duyệt. Điều này gây khó khăn khi:

  • Cơ quan quản lý yêu cầu giải thích cơ sở phê duyệt.
  • Khách hàng muốn biết lý do bị từ chối hoặc phải chịu mức lãi suất cao hơn.

Cân bằng rủi ro – lợi nhuận:

Ngân hàng phải đối diện với bài toán hai mặt:

  • Nếu cho vay quá chặt, họ sẽ bỏ lỡ nhiều khách hàng tiềm năng, đặc biệt là nhóm cá nhân/SME chưa có nhiều lịch sử tín dụng.
  • Nếu cho vay quá dễ, tỷ lệ nợ xấu sẽ tăng, ảnh hưởng trực tiếp đến an toàn vốn và lợi nhuận.

Tuân thủ pháp lý:

Ở nhiều quốc gia, luật quy định ngân hàng phải chứng minh mô hình chấm điểm tín dụng không mang tính phân biệt đối xử dựa trên yếu tố nhạy cảm (giới tính, tuổi tác, vùng miền...). Điều này tạo áp lực trong việc xây dựng mô hình vừa hiệu quả, vừa công bằng và minh bạch.

Nghiệp vụ hiện đại – mở rộng từ truyền thống

Thu thập & tích hợp dữ liệu đa nguồn

  • Dữ liệu truyền thống: CIC, lịch sử trả nợ, thu nhập, tài sản bảo đảm.
  • Dữ liệu phi truyền thống (Alternative Data): giao dịch ví điện tử, hành vi trên thương mại điện tử, hóa đơn điện tử, dữ liệu viễn thông, mạng xã hội.
  • Real-time Data: cập nhật tức thì khi khách hàng phát sinh giao dịch mới.
  • Tất cả dữ liệu được gom lại qua Data Lake hoặc hệ thống Data Warehouse để đảm bảo chất lượng và đồng bộ.

Làm sạch & tiền xử lý dữ liệu

Trước khi xây dựng mô hình chấm điểm tín dụng, dữ liệu cần được xử lý để đảm bảo tính đầy đủ và chính xác. Các bước chính bao gồm:

  • Loại bỏ dữ liệu nhiễu, thiếu, sai lệch Ví dụ: hồ sơ khách hàng thiếu số CMND/CCCD, thu nhập nhập sai đơn vị, hoặc dữ liệu bị trùng lặp.
  • Chuẩn hóa thông tin khách hàng Các trường thông tin thường được mã hóa hoặc quy định chặt chẽ để mô hình dễ xử lý:
    • Mã nghề nghiệp: thay vì lưu dạng text-based (ví dụ: “bác sĩ”, “giáo viên”, “nhân viên IT”), ngân hàng thường có thể chuẩn hóa thành mã số nghề nghiệp. Cách làm này giúp giảm rủi ro nhập liệu sai, dễ thống kê và xử lý tự động.
    • Địa chỉ: đồng nhất theo chuẩn (tỉnh, huyện, xã) thay vì để dạng văn bản tự do.
    • Thu nhập: quy đổi về cùng đơn vị (thường là VND/tháng), loại bỏ giá trị bất thường.
  • Áp dụng Feature Engineering Từ dữ liệu gốc, ngân hàng tính toán thêm các chỉ số quan trọng để phản ánh khả năng trả nợ và hành vi tài chính của khách hàng:
    • Debt-to-Income Ratio (DTI): Tỷ lệ tổng nợ phải trả hàng tháng trên tổng thu nhập hàng tháng. DTI cao cho thấy áp lực trả nợ lớn.
    • Credit Utilization Rate: là tỷ lệ giữa dư nợ thẻ tín dụng hiện tại (số tiền khách hàng đang nợ) so với hạn mức tín dụng được cấp (số tiền tối đa ngân hàng cho phép sử dụng). Chỉ số cao thể hiện khách hàng thường xuyên sử dụng hết hạn mức, rủi ro vỡ nợ tăng.
    • Transaction Frequency: Tần suất giao dịch tài chính (như số lần thanh toán, rút tiền, chuyển khoản). Tần suất quá thấp hoặc bất thường có thể là tín hiệu rủi ro hoặc gian lận.

Chấm điểm tín dụng bằng mô hình AI/ML

  • Mô hình truyền thống: Logistic Regression, Decision Tree (vẫn được dùng để dễ giải thích).
  • Mô hình nâng cao: Random Forest, Gradient Boosting (XGBoost, LightGBM) thì chính xác hơn, DNN, RNN (chuỗi giao dịch), GNN (quan hệ khách hàng).
  • Hybrid model: Nhiều ngân hàng kết hợp mô hình truyền thống (giải thích được) với các mô hình nâng cao (chính xác hơn). Cụ thể giai đoạn sàng lọc ban đầu: dùng mô hình truyền thống (Logistic Regression, Decision Tree) để có kết quả giải thích được, dễ báo cáo cho cơ quan quản lý. Còn giai đoạn ra quyết định chi tiết: dùng mô hình nâng cao (XGBoost, LightGBM, Deep Learning) để tăng độ chính xác dự báo rủi ro.

Ra quyết định & phê duyệt tự động

  • Real-time Scoring: khi khách hàng nộp hồ sơ online, hệ thống tự động chấm điểm và đưa ra gợi ý phê duyệt/ từ chối/ yêu cầu bổ sung thông tin.
  • Kết hợp với chính sách nội bộ: hạn mức tối đa, lãi suất phù hợp, yêu cầu tài sản đảm bảo.

Giải thích quyết định (Explainable AI – XAI)

  • Dùng SHAP, LIME để giải thích: vì sao khách hàng bị từ chối hoặc vì sao chỉ được cấp hạn mức thấp.
  • Điều này vừa giúp tuân thủ pháp lý, vừa nâng cao trải nghiệm khách hàng (tránh cảm giác “ngân hàng từ chối vô lý”).

Giám sát & phản hồi (Feedback Loop)

Sau khi khoản vay được phê duyệt và giải ngân, ngân hàng không dừng lại ở bước cấp vốn mà tiếp tục giám sát quá trình trả nợ của khách hàng. Những dữ liệu phát sinh trong giai đoạn này, như lịch sử thanh toán gốc và lãi, tình trạng chậm trả hay trả trước hạn, sẽ được ghi nhận thông qua:

  • Hệ thống core banking: nơi cập nhật toàn bộ biến động dư nợ và lịch sử trả nợ của từng khách hàng.
  • Báo cáo từ CIC: phản ánh tình trạng tín dụng được cập nhật định kỳ từ các tổ chức tín dụng.
  • Các kênh giao dịch điện tử: Internet Banking, Mobile Banking, ví điện tử liên kết, giúp ghi nhận hành vi chi tiêu và thanh toán. Những dữ liệu này được đưa ngược trở lại hệ thống chấm điểm tín dụng, giúp mô hình có thêm nguồn thông tin thực tế để hiệu chỉnh, từ đó dự báo rủi ro ngày càng chính xác hơn. Điểm khác biệt quan trọng nằm ở cách tiếp cận dữ liệu:
  • Trong quy trình truyền thống, thông tin khách hàng được coi là “vốn tĩnh” – tức là ngân hàng chỉ dựa vào dữ liệu tại thời điểm nộp hồ sơ và phê duyệt, ít có sự cập nhật trong suốt vòng đời khoản vay. Điều này dẫn đến việc mô hình nhanh chóng lạc hậu so với thực tế.
  • Ngược lại, với hệ thống hiện đại, dữ liệu được coi là “vốn động” – nghĩa là luôn được bổ sung, cập nhật và tái sử dụng. Khả năng quan sát hành vi tài chính của khách hàng theo thời gian giúp ngân hàng sớm nhận diện rủi ro (ví dụ: khách hàng bắt đầu chậm trả nhiều kỳ liên tiếp) hoặc phát hiện cơ hội (khách hàng trả nợ tốt, có thể nâng hạn mức). Nhờ vậy, cơ chế giám sát và phản hồi không chỉ giúp giảm thiểu rủi ro tín dụng, mà còn tạo nền tảng để ngân hàng cá nhân hóa dịch vụ, cung cấp sản phẩm phù hợp hơn với từng khách hàng.

Ví dụ: Nếu một khách hàng liên tục trả chậm trong 3 tháng gần nhất, hệ thống sẽ cập nhật ngay xác suất vỡ nợ (PD) của khách hàng này tăng cao, từ đó cảnh báo bộ phận quản lý rủi ro hoặc điều chỉnh hạn mức cho vay trong tương lai.

Các loại dữ liệu trong Credit Scoring

Trong hệ thống chấm điểm tín dụng, dữ liệu được chia thành nhiều nhóm:

Structured data (dữ liệu có cấu trúc)

  • Nguồn: CIC (lịch sử tín dụng tập trung), báo cáo dư nợ, tình trạng trả nợ đúng hạn, thu nhập khai báo, tài sản đảm bảo.
  • Đặc điểm: dữ liệu rõ ràng, dễ tổng hợp và dùng cho mô hình thống kê.

Unstructured data (dữ liệu phi cấu trúc)

  • Nguồn: nội dung SMS ngân hàng, email hóa đơn điện nước, hóa đơn mua sắm, lịch sử duyệt web.
  • Đặc điểm: dữ liệu ở dạng văn bản, hình ảnh, file giao dịch, cần công cụ NLP hoặc AI để phân tích.

Định tính vs định lượng

  • Định tính: các thông tin mô tả như nghề nghiệp, thời gian cư trú, tình trạng hôn nhân, độ ổn định công việc.
  • Định lượng: các con số cụ thể như tỷ lệ nợ/thu nhập (Debt-to-Income), số lần trễ hạn, số lượng khoản vay đang mở.

Alternative data (dữ liệu thay thế / phi truyền thống)

  • Đây là nguồn dữ liệu không nằm trong CIC hay hồ sơ vay vốn truyền thống, nhưng ngày càng được ngân hàng và Fintech tận dụng:
  • Dữ liệu viễn thông: số lần gọi điện, tần suất SMS, lịch sử nạp thẻ, phản ánh mức độ hoạt động kinh tế và tính ổn định của khách hàng.
  • Hành vi ví điện tử & ngân hàng số: tần suất giao dịch, số dư duy trì trung bình, thói quen tiêu dùng.
  • Thương mại điện tử (TMĐT): tần suất mua hàng, loại sản phẩm, mức chi tiêu trung bình.
  • Mạng xã hội: mức độ hoạt động, mạng lưới quan hệ, chỉ số uy tín (social trust score).

Xu hướng hiện nay

  • Ngân hàng và công ty tài chính tận dụng dữ liệu phi truyền thống để:
  • Phục vụ nhóm khách hàng new-to-credit (chưa từng vay vốn, không có lịch sử CIC).
  • Đánh giá rủi ro toàn diện hơn thay vì chỉ dựa vào CIC.
  • Giảm tỷ lệ từ chối vay không cần thiết và mở rộng thị trường.
  • Ví dụ: Một cá nhân chưa từng vay vốn ngân hàng nhưng có lịch sử giao dịch ví điện tử đều đặn, thanh toán hóa đơn đúng hạn, số điện thoại hoạt động liên tục trên 5 năm có thể được xem là khách hàng có độ tin cậy cao, dù CIC trống.

Kỹ thuật Feature Engineering cho Credit Scoring

Feature Engineering là quá trình biến đổi dữ liệu thô thành những features có giá trị dự đoán cao, giúp mô hình chấm điểm tín dụng hoạt động chính xác hơn. Một số kỹ thuật chính gồm:

Feature Improvement

  • Làm sạch dữ liệu, xử lý giá trị thiếu trong hồ sơ CIC.
  • Chuẩn hóa các thông tin như thu nhập, dư nợ để đảm bảo đồng nhất giữa các nguồn dữ liệu.

Feature Construction (xây dựng biến mới từ dữ liệu sẵn có)

  • Debt-to-Income Ratio (DTI) = Tổng nợ phải trả / Thu nhập.
    • Ví dụ: khách hàng thu nhập 20 triệu/tháng, nợ phải trả hàng tháng 8 triệu do đó DTI = 40%. Tỷ lệ này càng cao thì khả năng trả nợ càng rủi ro.
  • Credit Utilization Rate (CUR) = Dư nợ thẻ tín dụng / Hạn mức thẻ tín dụng.
    • Ví dụ: khách hàng có hạn mức 100 triệu, dư nợ hiện tại 80 triệu → CUR = 80%.
    • Các nghiên cứu cho thấy, CUR trên 70–80% thường là dấu hiệu khách hàng gặp áp lực tài chính, từ đó rủi ro vỡ nợ cao hơn.
  • Transaction Frequency: tần suất giao dịch thẻ hoặc chuyển khoản, giúp đánh giá mức độ hoạt động tài chính.

Feature Selection

Chọn ra những feature có ý nghĩa nhất, ví dụ: lịch sử trả nợ, tần suất trễ hạn, mức độ ổn định công việc.

  • Feature Extraction & Representation Learning
    • Sử dụng các kỹ thuật giảm chiều dữ liệu như PCA hoặc Autoencoder để trích xuất feature quan trọng từ dữ liệu giao dịch phức tạp.
  • AutoFE (Automated Feature Engineering)
    • Ứng dụng hệ thống tự động sinh feature từ big data (như log giao dịch, dữ liệu hành vi), giúp ngân hàng nhanh chóng phát hiện các tín hiệu rủi ro mà con người khó nhìn thấy.

Mô hình & Thuật toán trong Credit Scoring

Truyền thống

  • Logistic Regression: mô hình phổ biến nhất vì dễ giải thích, phù hợp dữ liệu tuyến tính.
  • Decision Trees: phân loại đơn giản, trực quan.

Nâng cao

  • Random Forest, Gradient Boosting (XGBoost, LightGBM): tăng độ chính xác, xử lý dữ liệu phức tạp, giảm nguy cơ overfitting.
  • Deep Learning:
    • DNN (Deep Neural Network): phù hợp khi dữ liệu có nhiều chiều (high-dimensional), nhiều dạng biến (nhân khẩu học, giao dịch, hành vi), cho phép mô hình hóa quan hệ phi tuyến phức tạp.
    • RNN (Recurrent Neural Network): phân tích chuỗi giao dịch theo thời gian (ví dụ: dòng tiền vào/ra hàng tháng).
    • GNN (Graph Neural Network): mô hình hóa mạng lưới quan hệ như bảo lãnh, đồng sở hữu, hoặc nhóm khách hàng liên kết.
  • Explainable AI (XAI):
    • SHAP, LIME: giải thích lý do từ chối hoặc cấp tín dụng, giúp tăng tính minh bạch và đáp ứng yêu cầu pháp lý.

Kết luận

  • Chấm điểm tín dụng hiện đại đang được xây dựng như một hệ thống AI-driven, kết hợp dữ liệu đa nguồn (truyền thống và phi truyền thống), kỹ thuật Feature Engineering, các thuật toán Machine Learning/Deep Learning và công cụ giải thích mô hình (XAI) để đáp ứng yêu cầu minh bạch và tuân thủ pháp lý.
  • Trong thời kỳ ngân hàng số, Credit Scoring trở thành nền tảng quan trọng để mở rộng tín dụng – tức là tạo điều kiện cho nhiều nhóm khách hàng trước đây khó tiếp cận vốn vay (chẳng hạn như người mới đi làm, kinh doanh cá thể, khách hàng chưa có lịch sử tín dụng) có cơ hội tham gia vào hệ thống tài chính chính thức. Điều này góp phần thúc đẩy tài chính toàn diện (financial inclusion), đồng thời giúp ngân hàng cân bằng giữa việc gia tăng khách hàng và kiểm soát rủi ro tín dụng.

Comments

Loading comments...