百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

我不允许自己还不了解AI流式数据的传输原理

wptr33 2025-01-03 19:20 13 浏览

前言

在日常工作中,相信大家对AI大模型的运用已经掌握得非常熟练,无论是通过大模型平台使用还是通过服务商提供的SDK来使用。

但亲手去实现从后端发送流式数据到前端接收流式数据这个过程,可能就涉及得不多。

今天我们就来简单实现一下这过程。

AI流式数据接口请求模式包括三种:

RESTful API:需要客户端频繁轮询服务器以获取更新,增加了延迟和网络负载,不适合实时数据流。

WebSocket:最适合双向流式数据,提供低延迟、全双工通信,非常适合实时双向数据流,如聊天应用和在线游戏。

Server-Sent Events (SSE):适合单向流式数据,实现简单,自动重连,适合服务器向客户端推送实时更新,但不支持客户端向服务器发送数据。

这里我们采用 Server-Sent Events 的请求模式。



PHP发送流式数据

后端代码使用PHP来实现流式数据的返回,用的是Laravel框架的路由:

Route::post('testStream', function () {
    set_time_limit(0);

    $str = '《唐诗三百首》共八卷(或作六卷),选诗三百一十首,不同刻本有三百二十一首、三百一十七首、三百零二首等多种,常用底本光绪年间的四藤吟社本为三百一十三首。称“三百首”可能是沿袭“诗三百”的说法,只是取其整数而已。此书分体编排,有五言古诗、七言古诗、五言律诗、七言律诗、五言绝句、七言绝句及乐府诸体,其中古体诗占三分之一,近体诗占三分之二。虽然全部作品只占全唐诗的一百六十分之一,但不少是唐诗传世佳作。此书收录作者七十七人,包括帝王、士大夫、僧人、歌女、无名氏等,大多数为唐诗代表作家。其中杜甫三十九首,王维二十九首,李白二十九首,李商隐二十四首,孟浩然、韦应物、杜牧各有十多首。从体裁来看,李白多收五、七言古诗和乐府,韦应物多收五言古诗,王昌龄多收七言绝句,李颀多收七言歌行;而且古体诗以盛唐为主,近体诗则多选中、晚唐。入选诗作有不少是唐诗中的名篇,大都通俗易解,艺术性较高,便于吟诵;其中不乏描写生活琐事、抒发个人情怀的诗作,间有内容空洞、形式呆板的应制、酬答之作。编者对入选的诗作还有选择地加以批语,简明扼要,对读者多有启发。有的批语虽只点一下,但颇耐回味。';

    return response()->stream(function () use ($str) {
        $chunks = mb_str_split($str, 10);
        foreach ($chunks as $chunk) {
            // 发送数据事件
            echo "data: " . htmlspecialchars($chunk) . "\n\n";

            // 强制输出缓冲区的内容
            ob_flush();
            flush();

            // 延迟一秒
            sleep(1);
        }

        // 关闭连接
        echo "data: Stream has ended.\n\n";

        // 确保所有数据都被发送
        ob_end_flush();
        flush();
    }, 200, [
        'Content-Type' => 'text/event-stream;charset=utf-8',
        'Cache-Control' => 'no-cache',
        'X-Accel-Buffering' => 'no',
        'Connection' => 'keep-alive'
    ]);
});

返回内容是一个固定的字符串,将其分片后依次返回。

注意Server-Sent Events的方式需要保证每行数据以 \n\n 两个换行符结尾。

header头参数:

  • Content-Type: text/event-stream;charset=utf-8 指定响应为SSE事件流,并使用UTF-8编码以支持多语言字符。
  • Cache-Control: no-cache 禁止浏览器缓存响应,确保客户端总是接收最新的实时数据。
  • X-Accel-Buffering: no 禁用Nginx的自动缓冲,使服务器生成的数据能够立即发送到客户端,减少延迟。
  • Connection: keep-alive 保持HTTP连接开放,允许服务器持续向客户端推送数据,提高性能并减少TCP握手的开销。

这里补充下SSE的消息格式

SSE消息由一系列字段组成,每个字段以冒号(: )开头,后面跟着字段值。常见的字段包括:

data::包含实际的数据内容。

event:指定事件类型,默认为message

id:为事件分配一个唯一的ID,用于自动重连时恢复最后收到的消息。

retry:指定客户端在连接断开后重新连接的等待时间(毫秒)。

每个字段必须以换行符(\n)结尾。一条完整的消息必须以两个换行符(\n\n)结尾,表示消息的结束。

如果消息包含多行数据,每行也应以换行符结尾。

JS接收流式数据

<html>

<body>
  <div id="message"></div>
</body>

<script>
  const text = document.getElementById('text');

  async function request() {
    const response = await fetch('http://127.0.0.1:8000/api/testStream', {
      method: 'POST',
    });

    if (!response.ok) {
      throw new Error(`HTTP error! status: ${response.status}`);
    }

    const reader = response.body.getReader();
    const decoder = new TextDecoder('utf-8');

    try {
      while (true) {
        const { done, value } = await reader.read();
        if (done) {
          break;
        }

        let text = decoder.decode(value, { stream: true });
        // 将文本按行分割,逐行处理
        const lines = text.split('\n');
        for (const line of lines) {
          // 忽略空行和非 data: 开头的行
          if (!line.trim() || !line.startsWith('data:')) continue;
          // 去掉 'data:' 前缀并处理剩余内容
          const content = line.substring(5).trim();
          message.innerHTML += content;
        }
      }
    } catch (error) {
      console.error('Stream reading error:', error);
    }
  }

  request();
</script>

</html>

我们通过fetch来请求后端数据

while (true) 来阻塞JS代码执行,持续从后端获取数据流

然后将得到数据用\n进行分割,去掉前缀 data:,拿到具体的内容

最后将得到的结果展示在浏览器上:

– 欢迎点赞、关注、转发、收藏【我码玄黄】,各大平台同名。

相关推荐

【推荐】一款开源免费、美观实用的后台管理系统模版

如果您对源码&技术感兴趣,请点赞+收藏+转发+关注,大家的支持是我分享最大的动力!!!项目介绍...

Android架构组件-App架构指南,你还不收藏嘛

本指南适用于那些已经拥有开发Android应用基础知识的开发人员,现在想了解能够开发出更加健壮、优质的应用程序架构。首先需要说明的是:AndroidArchitectureComponents翻...

高德地图经纬度坐标批量拾取(高德地图批量查询经纬度)

使用方法在桌面上新建一个index.txt文件,把下面的代码复制进去保存,再把文件名改成index.html保存,双击运行打开即可...

flutter系列之:UI layout简介(flutter ui设计)

简介对于一个前端框架来说,除了各个组件之外,最重要的就是将这些组件进行连接的布局了。布局的英文名叫做layout,就是用来描述如何将组件进行摆放的一个约束。...

Android开发基础入门(一):UI与基础控件

Android基础入门前言:...

iOS的布局体系-流式布局MyFlowLayout

iOS布局体系的概览在我的CSDN博客中的几篇文章分别介绍MyLayout布局体系中的视图从一个方向依次排列的线性布局(MyLinearLayout)、视图层叠且停靠于父布局视图某个位置的框架布局(M...

TDesign企业级开源设计系统越发成熟稳定,支持 Vue3 / 小程序

TDesing发展越来越好了,出了好几套组件库,很成熟稳定了,新项目完全可以考虑使用。...

WinForm实现窗体自适应缩放(winform窗口缩放)

众所周知,...

winform项目——仿QQ即时通讯程序03:搭建登录界面

上两篇文章已经对CIM仿QQ即时通讯项目进行了需求分析和数据库设计。winform项目——仿QQ即时通讯程序01:原理及项目分析...

App自动化测试|原生app元素定位方法

元素定位方法介绍及应用Appium方法定位原生app元素...

61.C# TableLayoutPanel控件(c# tabcontrol)

摘要TableLayoutPanel在网格中排列内容,提供类似于HTML元素的功能。TableLayoutPanel控件允许你将控件放在网格布局中,而无需精确指定每个控件的位置。其单元格...

想要深入学习Android性能优化?看完这篇直接让你一步到位

...

12个python数据处理常用内置函数(python 的内置函数)

在python数据分析中,经常需要对字符串进行各种处理,例如拼接字符串、检索字符串等。下面我将对python中常用的内置字符串操作函数进行介绍。1.计算字符串的长度-len()函数str1='我爱py...

如何用Python程序将几十个PDF文件合并成一个PDF?其实只要这四步

假定你有一个很无聊的任务,需要将几十个PDF文件合并成一个PDF文件。每一个文件都有一个封面作为第一页,但你不希望合并后的文件中重复出现这些封面。即使有许多免费的程序可以合并PDF,很多也只是简单的将...

Python入门知识点总结,Python三大数据类型、数据结构、控制流

Python基础的重要性不言而喻,是每一个入门Python学习者所必备的知识点,作为Python入门,这部分知识点显得很庞杂,内容分支很多,大部分同学在刚刚学习时一头雾水。...