Chiến lược thực sự để chiến thắng trong cuộc sống

Nói trước với ae rằng bài này không phải bài đạo lý,

cũng không dạy ai phải sống thế nào.

Nó là một mô hình chiến lược,

rút ra từ một nghiên cứu khoa học thực sự, được mô phỏng bằng máy tính, với dữ liệu rõ ràng.

Điều thú vị là, những kết quả mô phỏng đó cho ra lại trùng khớp với cách mà Đạo, tiến hóa, xã hội và đời sống con người thực sự vận hành.

Trước khi vào bài, tôi xin nhắc lại chút với ae về lý thuyết trò chơi (game theory).

Hiểu đơn giản thì game theory là "khoa học của chiến lược."

Nó nghiên cứu cách con người ra quyết định trong những tình huống mà kết quả của bản thân phụ thuộc vào lựa chọn của những người khác.

Nếu ae từng thương lượng giá, làm việc nhóm, yêu đương, cạnh tranh, kinh doanh, hoặc chỉ đơn giản là sống trong một cộng đồng,.... thì chính là việc ae đang “chơi game” mỗi ngày.

Nói chung, cuộc sống có thể chia thành hai loại trò chơi chính:

-Đầu tiên là trò chơi hợp tác (cooperative).

Trong đó, hai bên có cùng mục tiêu, cùng có lợi khi hợp tác.

Ví dụ như đồng đội trong thể thao, hai đối tác cùng phát triển sản phẩm, hoặc các quốc gia cùng ký hiệp định thương mại.

Trong trò chơi này, cả 2 sẽ cùng win.

-Loại thứ 2 là trò chơi phi hợp tác (non-cooperative).

Ở đây, mỗi bên sẽ hành động vì lợi ích riêng, đôi khi phải hi sinh hoặc làm hại bên kia.

Thế giới chúng ta đang sống phần lớn là loại thứ 2 này.

Tình huống nổi tiếng nhất trong lý thuyết trò chơi mà chắc hẳn nhiều ae đã biết, đó là "Thế lưỡng nan của tù nhân".

Có 2 người bị bắt vì nghi phạm tội và được đưa vào thẩm vấn trong 2 căn phòng riêng.

Nếu một người phản bội, tố cáo người kia, kẻ phản bội sẽ được tha, người còn lại (không nhận tội) bị nặng (ví dụ tù 20 năm).

Nếu cả hai cùng phản bội, cả hai cùng chịu hình phạt trung bình (ví dụ 5 năm).

Giờ thử nghĩ nếu rơi vào tình huống này thì ae sẽ làm gì?

-Nếu ae không nhận tội, mà người kia phản bội => ae toang.

-Nếu ae tố cáo, mà người kia không nhận => ae được thả.

-Nếu cả hai đều phản bội => cả hai cùng đi tù, nhưng vẫn hơn là không nhận rồi bị tố cáo (đi 20 năm).

Vậy nên kết luận, trong trường hợp này thì phản bội chính là lựa chọn an toàn nhất.

Tình huống này cũng là thứ xuất hiện trong gần như mọi khía cạnh của đời sống:

-Hai doanh nghiệp cùng bán một sản phẩm, thỏa thuận neo giá thì cùng hưởng lợi, còn thi nhau bán phá giá thì cùng lỗ.

-Hai người trong mối quan hệ, tin nhau thì cùng hạnh phúc, nghi kỵ thì cùng tổn thương.

-Hai quốc gia cùng giữ hòa bình thì phát triển kinh tế, chạy đua vũ trang thì cùng kiệt quệ.

Nếu cuộc chơi chỉ diễn ra một lần duy nhất, thì như đã phân tích phía trên, hành động “phản bội” là hiệu quả nhất.

Vì ae sẽ không phải gặp lại người còn lại, ae sẽ không bị trừng phạt, không có hậu quả dài hạn.

Nhưng đời sống thực thì lại không phải game chơi một lần.

Chúng ta sẽ gặp lại nhau trong công việc, trong xã hội, trong network.

Danh tiếng. Uy tín. Niềm tin.

Đó là hệ quả của những trò chơi lặp lại.

Và khi trò chơi lặp lại, chiến lược tối ưu sẽ thay đổi hoàn toàn.

Cái này thì khoa học đã test hộ ae rồi.

Năm 1980, Robert Axelrod tổ chức một giải đấu bằng máy tính.

Ông mời các chuyên gia gửi chiến lược (dưới dạng code) để chơi trò tù nhân lặp lại hàng trăm lượt.

Kết quả rất bất ngờ.

Chiến lược thắng cuối cùng không phải là chiến lược phản bội, gian xảo, phức tạp hay khôn lỏi nhất.

Mà là một chiến lược rất đơn giản.

Tên của nó là "Tit for Tat" (ăn miếng trả miếng).

Luật của nó thì chỉ có 2 dòng:

Bắt đầu bằng việc hợp tác.

Sau đó làm đúng những gì đối phương vừa làm.

Giả sử đối thủ của nó chơi đẹp => nó cũng chơi đẹp

Đối thủ chơi xấu => nó trả đũa bằng cách chơi xấu.

Nếu đối thủ quay lại hợp tác => nó quay lại hợp tác.

Ngoài ra, không chỉ chiến lược này, mà những chiến lược có đặc điểm tương tự như nó, cũng đạt được kết quả cao, nằm phía trên bảng xếp hạng.

Axelrod đã phân tích nguyên nhân và phát hiện ra rằng những chiến lược này có 4 đặc điểm chung:

-Thứ nhất là chúng "tử tế", không bao giờ phản bội trước.

-Thứ 2 là biết "tự vệ", phản đòn khi bị chơi xấu.

-Thứ 3 là "vị tha", biết tha thứ khi đối phương quay lại hợp tác.

-Và cuối cùng là "đơn giản", rõ ràng, dễ hiểu, dễ đoán.

Nghe giống đạo đức nhỉ? hêhe

Và sự thật đã lộ ra từ thử nghiệm này mà nhiều người không ngờ rằng:

"Những đặc điểm trên chính là cấu trúc của chiến lược tối ưu trong những trò chơi lặp lại."

Điểm mấu chốt của các kiểu "chiến lược chiến thắng" này là nó không cố thắng từng ván bằng cách phản bội (có thể dẫn tới phá hoại toàn hệ),

mà nó chỉ "cố không thua", để giữ cuộc chơi tiếp tục trong dài hạn.

=>Kết quả tất yếu là sau nhiều lượt chơi, tổng điểm của nó luôn cao.

Quá trình tiến hóa của tự nhiên cũng sẽ chọn đúng như vậy.

Vì Axelrod cũng đã mô phỏng luôn tiến trình đó cho chúng ta.

Ông để các chiến lược thắng sinh sôi, và chiến lược thua bị tuyệt chủng.

Tức là cái nào xếp hạng cao sau một vòng đấu sẽ được nhân bản lên để đấu tiếp các vòng sau.

Ban đầu, mấy thằng "chiến lược chơi bẩn" tăng trưởng rất nhanh.

Nhưng khi không còn ai để lừa, chúng sẽ tự chết cùng nhau.

Cuối cùng, chỉ còn lại những chiến lược "tử tế", (không phản bội trước, có cơ chế phản đòn, biết tha thứ, quy tắc rõ ràng) còn lại và tự nhân lên.

Chúng đã luôn "chọn hợp tác" để thích nghi và tồn tại cùng nhau.

Nhiều người đọc tới đây sẽ nghĩ:

“À, vậy thì phải cố gắng sống sao cho tốt.”

Không.

Sự thật phũ hơn nhiều:

Chúng ta không chỉ đơn giản là "muốn sống tốt."

Mà "hệ thống đã được thiết kế để chúng ta phải sống tốt."

Chính cái cấu trúc có sẵn của chọn lọc tự nhiên sẽ loại bỏ những "chiến lược bẩn thỉu", và giữ lại những "chiến lược tử tế".

=>Tức là ae sẽ không thể thắng trong trò chơi cuộc sống nếu chọn "chơi bẩn".

Trong Đạo Đức Kinh, có một đoạn như sau:

“Thất Đạo nhi hậu Đức,

thất Đức nhi hậu Nhân,

thất Nhân nhi hậu Nghĩa,

thất Nghĩa nhi hậu Lễ.”

Dịch nôm na ra là:

-Khi mất Đạo, người ta mới phải nói tới Đức

-Khi mất Đức, mới phải dựng ra Nhân

-Khi mất Nhân, mới phải viện tới Nghĩa

-Khi mất Nghĩa, mới phải ép bằng Lễ

Nói thẳng ra là nếu chúng ta càng phải “cố tỏ ra đạo đức”, thì chúng ta sẽ càng rời xa sự thật.

Vì sao?

Vì "Đạo" mà Lão Tử nhắc tới ở đây không phải là "đạo đức."

"Đạo" là cấu trúc vận hành tự nhiên của hệ thống.

Khi vận hành đúng Đạo, thì con người không cần cố tử tế, không cần khoe rằng tôi “sống đẹp”, hay đóng vai người tốt.

Nhân - Nghĩa - Lễ - Trí - Tín sẽ tự nhiên sinh ra, giống như kết quả phụ của một thuật toán chạy đúng.

Trong thí nghiệm của Axelrod, cái mà máy tính phát hiện ra không phải là "con người nên sống tốt."

Mà là một cơ chế được ẩn sâu:

"Trong trò chơi lặp lại, những chiến lược vận hành thuận với cấu trúc chọn lọc của hệ thống tự nhiên sẽ sống sót."

"Tit for Tat" (và các chiến lược tương tự) đã thắng không phải vì chúng tốt bụng, chúng thắng vì chúng "thuận Đạo."

Ngược lại, mấy thằng “chiến lược chơi bẩn” có thể thắng nhanh, lừa giỏi, khôn vặt, đạt được lợi ích trước mắt.

Nhưng thực ra chúng đang làm "nghịch Đạo", vì chống lại "cơ chế chọn lọc" của game lặp.

Và kiểu gì thì kiểu, cuối cùng chúng sẽ bị hệ thống loại bỏ.

Chẳng cần đạo đức.

Chẳng cần pháp luật.

Chẳng cần người phán xét.

Chỉ đơn giản là:

=>Không ai muốn chơi tiếp với chúng.

=>Không ai hợp tác.

=>Không còn network.

=>Không còn vòng lặp để chúng tiếp tục chơi.

Cho nên, bài này không phải bài khuyên ae “hãy sống tử tế”.

Mà là bài để nói thẳng vào "sự thật tất yếu của thế giới."

Rằng:

Nếu chúng ta sống trong một thế giới của game lặp lại, mà vẫn chơi chiến lược của game một lần, thì sớm hay muộn, chúng ta cũng sẽ không còn chỗ để chơi.

Người thực sự hiểu game, hiểu Đạo, thì không cần làm thánh, không cần giả đạo đức.

Chỉ cần hành xử thuận theo cấu trúc của hệ thống.

Cấu trúc đó có cơ chế chọn lọc hành vi,

và cơ chế đó sẽ "chọn sự tử tế."

Đó chính là thuật toán thật sự của nó.