Mô hình thử nghiệm mới của Google, Gemini-Exp-1206

Mô hình thử nghiệm mới nhất của Google, Gemini-Exp-1206, hứa hẹn hỗ trợ giới phân tích giảm bớt một trong những nhiệm vụ nặng nề nhất: đồng bộ hóa dữ liệu và biểu đồ trực quan để kể một câu chuyện thuyết phục, mà không cần phải thức trắng đêm.

VBeat

12/27/20248 min read

Mô hình thử nghiệm mới nhất của Google, Gemini-Exp-1206, hứa hẹn hỗ trợ giới phân tích giảm bớt một trong những nhiệm vụ nặng nề nhất: đồng bộ hóa dữ liệu và biểu đồ trực quan để kể một câu chuyện thuyết phục, mà không cần phải thức trắng đêm.

Những chuyên viên phân tích đầu tư, nhân viên ngân hàng cấp cơ sở hay thành viên đội tư vấn đặt mục tiêu thăng tiến thường chấp nhận làm việc kéo dài đến đêm khuya hoặc cuối tuần, thậm chí “trắng đêm” khi cần. Nhiều người xem đây như bước đệm quan trọng giúp họ tạo dấu ấn và sớm giành suất lên vị trí cao hơn.

Phần công việc ngốn nhiều thời gian nhất chính là xử lý phân tích dữ liệu chuyên sâu, đồng thời tạo các biểu đồ đủ sức củng cố một kịch bản hoặc câu chuyện nhất quán. Thử thách trở nên lớn hơn khi mỗi hãng ngân hàng, công nghệ tài chính (fintech) và công ty tư vấn như JP Morgan, McKinsey, PwC lại sở hữu những quy tắc, format, quy ước riêng về phân tích và trực quan hóa dữ liệu.

VentureBeat đã phỏng vấn các thành viên đội dự án nội bộ, vốn được các công ty trên thuê để thực hiện công việc cụ thể. Theo họ, việc tạo ra những biểu đồ cô đọng và hệ thống được khối dữ liệu khổng lồ là một rào cản thường trực. Có nhân sự cho biết, việc các đội tư vấn phải thức đêm để chỉnh sửa ít nhất 3-4 phiên bản biểu đồ trước khi chốt để báo cáo ban lãnh đạo là điều rất bình thường.

Vì sao Gemini-Exp-1206 trở thành “ca thử” ấn tượng?

Quá trình mà các chuyên viên phân tích dựa vào để tạo bài trình bày (presentation) có biểu đồ và nội dung thống nhất thường gồm nhiều bước thủ công, lặp lại. Điều đó khiến họ “nhắm” đến mô hình mới của Google như một ví dụ đầy tiềm năng để kiểm nghiệm.

Đầu tháng 12, ông Patrick Kane (Google) viết trong thông cáo về Gemini-Exp-1206:

“Dù bạn đang giải quyết những thử thách lập trình phức tạp, làm toán cho dự án học tập hay cá nhân, hoặc xây dựng hướng dẫn nhiều bước để lập một kế hoạch kinh doanh riêng, Gemini-Exp-1206 sẽ giúp bạn xử lý các tác vụ phức tạp thuận lợi hơn.”

Google cũng nhấn mạnh khả năng vượt trội của mô hình trong các nhiệm vụ đòi hỏi tính toán phức tạp, viết mã, cùng việc tuân thủ các chỉ dẫn đa bước.

Trong tuần qua, VentureBeat đã “chạy thử” Exp-1206 một cách toàn diện. Nhóm thực hiện hơn 50 đoạn mã Python, nỗ lực tự động hóa và tích hợp phân tích dữ liệu cùng các biểu đồ trực quan, dễ hiểu, giúp đơn giản hóa tập dữ liệu phức tạp. Vì chủ đề “hyperscaler” (các nhà cung cấp hạ tầng đám mây quy mô lớn) đang được bàn tán sôi nổi, mục tiêu cụ thể của chúng tôi là xây dựng một phân tích thị trường công nghệ, đồng thời tạo bảng biểu và đồ thị nâng cao hỗ trợ.

Sau hơn 50 phiên bản mã Python, chúng tôi thu được các kết quả sau:

  1. Càng phức tạp, mô hình càng “thử đoán” nhiều hơn

    • Exp-1206 cố gắng suy luận nhu cầu của người dùng từ một prompt (đoạn lệnh) phức tạp và có thể thay đổi đầu ra dù chỉ một khác biệt rất nhỏ trong câu lệnh. Ví dụ, mô hình có thể hoán đổi định dạng các bảng nếu người dùng mô tả nhẹ về vị trí bảng so với đồ thị “spider graph” phân tích thị trường hyperscaler.

  2. Buộc mô hình tạo phân tích dữ liệu phức tạp và xuất file Excel nhiều tab

    • Dù không hề được “ra lệnh” tạo sổ Excel đa trang, Exp-1206 vẫn tự chia thành ba tab: một tab chứa phân tích dạng bảng, một tab chứa biểu đồ, và tab phụ trình bày dữ liệu bổ sung.

  3. Yêu cầu mô hình lặp đi lặp lại (iterate) và gợi ý 10 dạng biểu đồ “phù hợp nhất”

    • Nhằm giảm bớt cảnh phải tự tạo 3-4 phiên bản slide trước khi gửi cấp trên, chúng tôi yêu cầu Exp-1206 sinh ra nhiều kiểu sơ đồ. Những sơ đồ này có thể tinh chỉnh và ghép vào bài thuyết trình, tiết kiệm hàng giờ lao động để vẽ và hiệu chỉnh.

Thúc đẩy Exp-1206 đến những tác vụ phức tạp hơn

VentureBeat muốn đánh giá “độ bền” của mô hình khi xử lý các tác vụ đa tầng (layered tasks) và phức tạp. Hiệu suất của Exp-1206 qua hơn 50 kịch bản Python cho thấy mô hình rất nhanh nhạy với mọi điều chỉnh trong đoạn lệnh và phản ứng tức thì. Exp-1206 “linh hoạt” và thích ứng theo từng thay đổi trong lịch sử prompt.

Khi chạy mã Python do Exp-1206 viết ra trong Google Colab, chúng tôi nhận thấy biểu đồ mạng nhện tám tiêu chí (eight-point spider graph) hiển thị nhiều chi tiết thú vị: từ cách đổ bóng (shading) đến khả năng làm mờ (translucency) của từng lớp dữ liệu, nhằm so sánh sáu hyperscaler. Dù tám tiêu chí đó vẫn giữ nguyên, cách biểu diễn đồ họa có sự khác nhau nhẹ giữa các lần thử.

“Trận chiến” giữa các hyperscaler

Để thử nghiệm, chúng tôi chọn 12 nhà cung cấp (hyperscaler) gồm:

  • Alibaba Cloud

  • Amazon Web Services (AWS)

  • Digital Realty

  • Equinix

  • Google Cloud Platform (GCP)

  • Huawei

  • IBM Cloud

  • Meta Platforms (Facebook)

  • Microsoft Azure

  • NTT Global Data Centers

  • Oracle Cloud

  • Tencent Cloud

Tiếp đến, nhóm viết một prompt gồm 11 bước, dài hơn 450 từ. Mục tiêu: đo lường khả năng xâu chuỗi logic tuần tự của Exp-1206, để xem liệu mô hình có “lạc lối” giữa hàng loạt chỉ dẫn hay không (phụ lục cuối bài mô tả chi tiết prompt).

Chúng tôi nạp prompt này vào Google AI Studio, chọn mô hình Gemini Experimental 1206, rồi sao chép phần mã Python vào Google Colab (tạo notebook “Hyperscaler Comparison – Gemini Experimental 1206.ipynb”). Kết quả: tập lệnh chạy “mượt,” sinh ra ba tệp (có đánh dấu mũi tên đỏ ở góc trên bên trái ảnh màn hình).

So sánh hyperscaler và tạo biểu đồ — hoàn tất trong chưa đầy một phút

Loạt chỉ dẫn đầu tiên yêu cầu Exp-1206 tạo mã Python so sánh 12 hyperscaler theo tên sản phẩm, tính năng nổi bật, điểm khác biệt, cũng như vị trí trung tâm dữ liệu. Sau đó xuất thành một file Excel. Toàn bộ quá trình format dữ liệu trong bảng chỉ mất chưa đến một phút.

Tiếp theo, mô hình được yêu cầu tạo một bảng gồm ba cột, bảy hàng, so sánh 6 hyperscaler (AWS, GCP, IBM Cloud, Meta/Facebook, Microsoft Azure, Oracle Cloud) ở phía trên trang, rồi đặt biểu đồ “spider graph” bên dưới. Exp-1206 tự động chọn phương thức xuất dữ liệu dưới dạng HTML.

Cuối cùng, chúng tôi yêu cầu Exp-1206 chọn tám tiêu chí để so sánh sáu hyperscaler nói trên và xây dựng đồ thị mạng nhện. Chuỗi chỉ dẫn này được mô hình biến thành mã Python, tạo ra một tập tin hiển thị ngay trong phiên Colab.

Mô hình được “may đo” để tiết kiệm thời gian cho giới phân tích

VentureBeat cho biết nhiều chuyên viên phân tích đã và đang chia sẻ thư viện prompt “cá nhân hóa” cho những mô hình AI nhất định, với mục tiêu hợp lý hóa quy trình báo cáo, phân tích, trực quan hóa trên quy mô toàn đội.

Những nhóm thực hiện dự án tư vấn lớn cần cân nhắc khai thác mô hình như Gemini-Exp-1206 để tăng mạnh năng suất, hạn chế phải làm việc 60+ giờ mỗi tuần hoặc phải “chạy” thâu đêm. Chuỗi prompt được tự động hóa hoàn toàn có thể làm nhanh phần “tìm hiểu mối liên quan” trong dữ liệu, giúp chuyên viên tạo biểu đồ với độ chính xác cao mà không tốn nhiều thời gian.

Phụ lục: Google Gemini Experimental 1206 Prompt Test

(Nguyên văn nội dung hướng dẫn bằng tiếng Anh, liệt kê đầy đủ các bước yêu cầu, cách xuất file Excel, tạo bảng, xây dựng đồ thị mạng nhện, cùng danh sách 12 hyperscaler.)