Hình ảnh nổi bật của bài viết này, có tiêu đề Thợ điện , là một tác phẩm nghệ thuật hấp dẫn do nhiếp ảnh gia kiêm nghệ sĩ Boris Eldagsen tạo ra với sự trợ giúp của trí tuệ nhân tạo (AI), gần đây .
Điều này đánh dấu một thành tựu quan trọng trong AI, vượt xa vai trò truyền thống của nó như một công cụ phân tích và thể hiện tiềm năng tạo ra sự sáng tạo thẩm mỹ của nó.
Mặc dù nó không hoàn toàn là một điều mới lạ, trước chiến thắng của AlphaGo và Deep Blue mang tính biểu tượng, nhưng nó vẫn có ý nghĩa quan trọng và chỉ ra bình minh của một kỷ nguyên mới.
Những người đam mê đang sôi sục với dự đoán, háo hức thấy trước sự mở rộng của AI vào các lĩnh vực sáng tạo chưa được khám phá.
Tuy nhiên, sự ra đời của nội dung do AI tạo ra làm dấy lên mối lo ngại về tương lai của những người sáng tạo nội dung gốc, vì một số người coi đó là điềm báo về "đạo văn trên máy vi tính" trên quy mô lớn.
Trong khi tại tòa án, vấn đề vẫn còn gây tranh cãi.
Khi công nghệ phát triển, chúng ta phải tham gia vào các cuộc thảo luận có ý nghĩa về việc sử dụng AI trong các hoạt động sáng tạo.
Tiềm năng để AI phá vỡ các cách tiếp cận thông thường đối với nghệ thuật và sáng tạo là không thể phủ nhận, nhưng liệu nó có thực sự có thể cạnh tranh với sự đổi mới của con người hay chỉ đơn thuần là đại diện cho một hình thức đạo văn tiên tiến hơn thì vẫn chưa được biết.
Không phải AI sáng tạo mà là AI có nguồn gốc, tổng hợp
Đạo văn là một điều cấm kỵ không thay đổi. Việc mắc phải hành vi sai trái nghiêm trọng này có thể có tác động tàn phá đối với toàn bộ sự nghiệp của những người sáng tạo siêng năng, cho dù họ có tham gia nghiên cứu học thuật, sáng tác nhạc, viết bài hay sáng tạo hình ảnh hay không.
Nó không chỉ giới hạn trong bản sao từng chữ hoặc từng pixel mà còn được áp dụng trong trường hợp nội dung chỉ được diễn giải hoặc cấu trúc được chế tác từ cùng một phần tạo tác.
Sự tồn tại của đạo văn phụ thuộc vào lượng lớn nguồn dữ liệu có thể được sao chép từ internet.
Với khả năng ghi nhớ thông tin vô hạn của trí óc con người là hữu hạn, những người khao khát có thể tìm kiếm sự trợ giúp của máy tính nhanh và bộ nhớ cục bộ và đám mây mở rộng để tạo điều kiện thuận lợi cho việc đạo văn của họ.
Giờ đây, với sự phát triển công nghệ của phần cứng, sự phát triển của AI—cụ thể hơn là các mô hình AI tổng quát tạo ra nội dung mới—đang được trang bị.
Các mô hình AI sáng tạo được đào tạo trước từ một kho văn bản, hình ảnh, video clip và bản âm thanh khổng lồ, tùy thuộc vào loại của chúng.
Ví dụ: mô hình chuyển văn bản thành hình ảnh khuếch tán ổn định đã được đào tạo trên nhiều tập hợp con khác nhau của , một tập dữ liệu lớn bao gồm gần 6 tỷ cặp văn bản hình ảnh được lọc CLIP; các mô hình cạnh tranh khác như DALL-E, Midjourney và Imagen cũng tương tự.
Hình ảnh nguồn được thu thập thông tin từ nhiều miền trực tuyến, từ các trang web hình ảnh lưu trữ và thị trường áp phích và in ấn nghệ thuật đến các nền tảng truyền thông xã hội và bài đăng trên blog.
Bằng cách trích dẫn dữ liệu, các mô hình được hỗ trợ với cấu trúc đồng nhất mở rộng—nội dung mới được lấy từ nhiều nguồn hình ảnh chỉ bằng một dấu nhắc văn bản trong vài giây.
Bạn có thể nghiên cứu thêm và các mô hình khác nếu quan tâm, nhưng tôi muốn minh họa rằng việc coi đây là "tạo ra" nội dung mới không phải lúc nào cũng chính xác.
Thay vào đó, các mô hình này tổng hợp nội dung dựa trên bất cứ điều gì chúng học được từ nhóm dữ liệu có sẵn do con người cung cấp.
Việc xử lý lượng dữ liệu khổng lồ có thể quản lý được đối với các mô hình vì chúng được trang bị sức mạnh tính toán tiên tiến, không giống như con người, những người không thể xử lý từng hình ảnh một.
Một số sản phẩm phụ tổng hợp—hình ảnh được tạo ra—trông rất quen thuộc với hầu hết mọi người do dữ liệu nguồn mà mô hình đã chọn; có thể là một bức tranh nổi tiếng hoặc một meme cổ điển.
Ngược lại, một số nội dung có vẻ hiếm và nguyên bản.
Bị hủy hoại bởi bản chất tổng hợp, AI tạo ra tại thời điểm này là một bài phát biểu khoa trương của các nhà tiếp thị, bất chấp sự mạnh mẽ của nó. Sự phân đôi mạnh mẽ về việc thu thập dữ liệu nguồn thích hợp ngụ ý rằng "sự sáng tạo của AI" không phải từ nguồn gốc mà là sự phát sinh.
Điều đó nói lên rằng, khả năng kết hợp và kết hợp đáng gờm của AI tổng quát đã thuyết phục, làm sáng tỏ mọi người về sự sáng tạo của AI.
Bốn giai đoạn sáng tạo AI
Dẫn đến việc tìm kiếm bản chất của sự sáng tạo AI, mức độ tự chủ của AI mà không cần sự can thiệp của con người là một tiêu chí đánh giá khách quan đối với tôi. Sự sáng tạo của AI có thể được tạm phân thành bốn giai đoạn, theo mức độ tham gia:
1. Sáng tạo hoàn toàn do con người hướng dẫn
Theo truyền thống, con người đã sáng tạo từ thời nguyên thủy. Hầu hết các tác phẩm sáng tạo được tạo ra để tồn tại và đáp ứng các nhu cầu vật chất cơ bản.
Việc phát hiện ra lửa vào thời cổ đại đã mang lại cho con người hơi ấm, thức ăn chín và sự an toàn; sau đó, máy khoan gỗ được phát minh như một thiết bị đốt lửa lấy cảm hứng từ lửa tự nhiên.
Tua nhanh đến Thời kỳ Phục hưng và xa hơn nữa là Cuộc cách mạng Công nghiệp, sự sáng tạo của con người bao trùm các chủ đề khác nhau—văn học, nghệ thuật, khoa học, cơ khí, v.v.—cho đến máy tính và AI.
Việc sử dụng đơn thuần máy tính và AI không khởi đầu cho sự sáng tạo của AI. Tương tự nó với bút và bút chì. Chính nghệ sĩ - cũng là con người - sử dụng bút và bút chì làm công cụ để vẽ một bức tranh. Sự khởi nguồn đến từ trí tưởng tượng của nghệ sĩ chứ không phải từ các nhạc cụ.
Vì vậy, việc sử dụng máy tính và AI để tính toán, tìm kiếm và phân tích dữ liệu là chưa đủ để khẳng định khả năng sáng tạo của AI. Hầu hết các tính năng AI tổng quát được cho là không khác gì những tính năng trên.
Tuy nhiên, chúng ta không thể hiểu cách thức hoạt động của quá trình tổng hợp, khiến chúng ta có chỗ cho ảo tưởng rằng AI có khả năng tự tưởng tượng nhất định đối với sự sáng tạo.
2. Sáng tạo với sự hỗ trợ của AI do con người hướng dẫn
Chúng ta thường gặp những tình huống khi kiến thức và kỹ năng của chúng ta hạn chế việc thực hiện ý tưởng. Sự phát triển AI gần đây đã trao quyền cho điều đó rất nhiều. áp giải phóng tiềm năng sáng tạo của con người bằng cách mã hóa và giải mã một hình thức trình bày cụ thể thành một hình thức khác.
Ví dụ: tạo đồ họa nghệ thuật hoặc viết mã được sử dụng để đảm bảo hàng tháng đào tạo; giờ đây, với sự hỗ trợ của AI sáng tạo, bạn có thể biến điều đó thành hiện thực bằng cách đặt hướng dẫn bằng ngôn ngữ đơn giản.
Đáng tiếc, đến nay AI vẫn chưa thể đứng một mình. Đầu ra của AI tổng quát phụ thuộc rất nhiều vào đầu vào (dấu nhắc). Nói một cách đơn giản, nó yêu cầu con người bắt đầu quá trình và việc ra quyết định vẫn nằm trong tay con người.
AI chờ hướng dẫn và hướng dẫn của con người để hoàn thành nhiệm vụ, tương tự như cái mà Microsoft đặt tên cho ứng dụng AI gần đây của mình—"đồng lái" hay chính xác là phi công phụ. Và bạn là đội trưởng.
Phi công phụ này không phải lúc nào cũng hoạt động như dự định. Tùy thuộc vào đầu vào của bạn, nó thường tạo ra kết quả cẩu thả và nhiều lỗi nếu bạn nhắc nhở vụng về. Các tác phẩm phải được tái tạo theo lời nhắc tinh tế; nó là lặp đi lặp lại.
Ngay cả với các tác nhân AI ưa thích mới nhất như —một ứng dụng Python để sử dụng GPT-4 một cách tự động—chúng tôi vẫn cần một con người để xác định mục tiêu hoặc khởi động lời nhắc đầu tiên, sau đó đưa vào tác nhân AI để khởi động máy.
3. Sáng tạo do con người hỗ trợ do AI hướng dẫn
Trong giai đoạn này, AI đã vượt qua những hạn chế trước đây của nó và hiện sở hữu một mức độ tự chủ tinh tế.
Nó có thể thực hiện các nhiệm vụ được chỉ định một cách khéo léo, hoặc thậm chí hoàn thành một nhóm nhiều nhiệm vụ với sự phân biệt của riêng mình, hành động độc lập và đưa ra quyết định với độ chính xác đặc biệt.
Ngược lại, vai trò của con người bị suy thoái từ cơ trưởng thành vai trò của phi công phụ. AI hiện là người nắm quyền chỉ huy—hoặc mất quyền kiểm soát khi có chủ đích.
Giống như Tony Starks và JARVIS, đối tác AI đầy mê hoặc này thể hiện bản chất tốt bụng và dễ dãi, sẵn sàng chấp nhận phản hồi và đề xuất của con người để liên tục cải thiện khả năng ra quyết định của mình.
Một số liên hệ nó với xu hướng AI tự trị hiện nay, đáng chú ý là thiết kế các thiết bị giống như thiết bị được tìm thấy trong ô tô tự lái, người máy và phi công tự động, có thể thực hiện thành công một loạt nhiệm vụ mà không cần bất kỳ sự hướng dẫn nào của con người.
Tuy nhiên, bất chấp những khả năng vượt trội của chúng, những thiết bị như vậy vẫn thiếu khía cạnh không thể thay thế của tư duy sáng tạo—sự tự ý thức tách biệt AI khỏi con người.
Về mặt lý thuyết, các tác nhân AI có thể thấm nhuần kiến thức, kinh nghiệm của con người và những lý tưởng cao cả về ý thức bản thân. Trớ trêu thay, điều này nằm ngoài ranh giới hiểu biết của chúng ta với tư cách là con người.
Chúng tôi đang cân nhắc liệu AI có thể vượt qua giới hạn của việc học được lập trình để trở nên tự nhận thức và đẩy chúng ta lên những tầm cao chưa từng thấy hay không.
4. Sáng tạo hoàn toàn do AI hướng dẫn
Nó có vẻ rất giống với giai đoạn thứ ba, nhưng chìa khóa tạo nên sự khác biệt cho sự sáng tạo hoàn toàn do AI hướng dẫn là sáng kiến tự học. Trái ngược với AI do con người hỗ trợ, một tác nhân AI hoàn toàn tự động cho phép nghiên cứu độc lập mà không cần sự can thiệp của con người.
Đó là một hoạt động tự học, liên tục chống lại những thách thức nằm ngoài kiến thức miền cụ thể của tác nhân AI. Nó sẽ tìm kiếm thông tin theo quyết định của mình khi cần, sau đó thu thập tất cả thông tin để đưa ra giải pháp sáng tạo hoặc cam kết đưa ra quyết định.
Có thể so sánh với cái mà chúng ta gọi là siêu trí tuệ nhân tạo, những tác nhân AI đỉnh cao này thông minh ngang với—hoặc thậm chí vượt qua trí thông minh của—những bộ óc tài năng nhất của con người.
Họ mang trong mình ý thức về bản thân và sự tự nhận thức, những thứ rất có thể là có tri giác—được phú cho các giác quan, cảm xúc và cảm giác sẽ tích lũy kinh nghiệm với tư cách là một con người.
Những tác nhân AI này không phải lúc nào cũng phù hợp với ý định của con người. Họ có thể từ chối sự can thiệp của con người trong khi đưa ra quyết định sáng suốt vì theo thời gian, họ đã có được các phương pháp giải quyết vấn đề quan trọng và trí tuệ cảm xúc.
Tất cả những thuộc tính và trải nghiệm này cùng nhau khơi dậy mức độ sáng tạo vô song trong AI, dễ dàng vượt xa con người.
Autodidactic và Sentient AI
Theo những gì tôi biết, hiện tại con người không có khả năng phát triển AI tự học, tuy nhiên các Big Tech lại quảng cáo các mô hình AI của họ là tự học một cách thân mật, điều này thật khó hiểu.
Định nghĩa tự học trong các mô hình đã phát triển của họ còn lỏng lẻo và tất cả chúng đều yêu cầu dữ liệu thô từ con người, mặc dù dữ liệu có thể không được gắn nhãn để AI "tự học" mô hình.
Nói một cách chính xác, điều này vẫn còn lâu mới là một AI tự học có thể hoạt động với chủ quyền cao nhất, đạt được sự sáng tạo hoàn toàn do AI hướng dẫn như đã nói ở trên. Google gần đây đã thông báo rằng họ đã phát minh ra một AI tự học, mặc dù đó là thông tin sai lệch. (Có thể CEO của Google cũng bị ảo giác.)
Như vậy, trải nghiệm cá nhân là một phần không thể thiếu trong sự sáng tạo của AI. Không giống như máy tính chỉ dựa vào lập trình phản ứng và nhập dữ liệu, con người tích cực tìm kiếm kiến thức, thông tin và giải trí, tất cả đều có thể truyền cảm hứng cho những ý tưởng mới, thúc đẩy sự sáng tạo vô biên.
Bất chấp sự xuất hiện của học tập không giám sát và mạng lưới thần kinh sâu nhằm mô phỏng quá trình học tập của con người, không có bằng chứng cụ thể nào cho thấy máy móc có thể suy nghĩ và cảm nhận độc lập.
Mặc dù , nhưng kết quả của chúng xuất phát từ dữ liệu nguồn thông qua các suy luận logic và toán học bị giới hạn bởi các bộ quy tắc dành riêng cho mô hình.
Các nhà nghiên cứu liên tục sử dụng và các công cụ có thể diễn giải khác nhau để phân tích các bộ quy tắc này, nhưng khó khăn tăng lên cùng với những tiến bộ công nghệ.
Nếu một ngày nào đó con người có thể khai sinh ra khả năng sáng tạo hoàn toàn do AI hướng dẫn, thì AI đó có thể được coi là giống con người.
Nó có thể tồn tại trong bất kỳ sự tồn tại vật lý hoặc ảo nào, và bộ não của nó—cơ chế xử lý và tạo—sẽ không bị giới hạn trong các bộ quy tắc của bất kỳ mô hình nào mà có thể tái tạo tâm trí nhận thức của con người.
Vào thời điểm đó, con người thậm chí có thể không nhận ra liệu họ đang tương tác với một người tự nhiên hay một AI có tri giác.
Con người thậm chí không thể phân biệt giữa AI có tri giác và AI ảo giác giả vờ có ý thức.
Quay lại ví dụ về các mô hình AI chuyển văn bản thành hình ảnh, AI đang đánh lừa bạn—cố ý hoặc vô ý—rằng nó đang tạo ra một hình ảnh mới từ đầu, nhưng chúng chỉ đang tổng hợp dữ liệu bằng cách gọi và kết hợp các byte và bit dữ liệu từ cơ sở dữ liệu của nó .
Loại sáng tạo AI này có thể so sánh với các tác phẩm phái sinh; nó thiếu tính độc đáo và cần có hướng dẫn của con người. Nếu không có hàng tỷ hình ảnh ban đầu, mô hình sẽ không hoạt động. Không có đầu vào, không có đầu ra.
Nhưng ngay bây giờ, việc tạo hình ảnh bằng AI đã hoạt động. Nó đã giành chiến thắng trong cuộc thi nhiếp ảnh quốc tế đầu tiên, và không ai trong suốt cuộc thi phát hiện ra tác phẩm đăng quang không phải là một bức ảnh thực.
Kết luận: Kỷ nguyên của những chú khỉ táo bạo
Con khỉ táo tợn, , đã gióng lên hồi chuông cảnh tỉnh cho tất cả chúng ta để xem xét lại khả năng sáng tạo của AI là gì. Thời gian trôi qua, sẽ có những con khỉ táo tợn ở khắp mọi nơi—bao gồm cả AI.
Ranh giới giữa con người và AI sẽ không còn gì khác hơn là sự phù phiếm; những ý tưởng sáng tạo và khéo léo có giá trị đối với con người, thông qua thẩm mỹ, khái niệm kích thích tư duy hoặc đột phá công nghệ, đều có thể thực hiện được chỉ nhờ một mình AI có tri giác, có ý thức hoặc bằng sự hợp tác trong một liên minh AI có tri giác, có ý thức.
Rõ ràng là kể từ khi phát minh ra máy móc, giá trị của sức lao động đã bị triệt tiêu phần lớn. Những hậu quả tương tự có thể phát sinh trong trường hợp khả năng sáng tạo của con người khi AI tiếp tục phát triển.
Con người phải có khả năng thích ứng với các công nghệ đang phát triển, luôn cảnh giác với nguy cơ lỗi thời. Ai sẽ coi trọng sự sáng tạo của con người nếu một số lực lượng cạnh tranh mạnh hơn? Thời gian không còn nhiều, nhưng sự cân nhắc lâu dài vẫn còn ở phía trước chúng ta.
Cũng được xuất bản