百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

.NET零拷贝实现大String编码到多个非连续内存块中

wptr33 2025-07-01 23:40 6 浏览

在网络通讯中很少会针对Socket设置大的Buffer,毕竟这样做非常浪费内存;最重要是这个最大值很难去评估的, 如果为每个连接分配1MB或更大的空间当1万个连接那需要非常大的内存,实际应用中可能对对更大的消息!所以应用中可以把消息写入多个非连续的Socket Buffer就显得非常重要了。接下来就介绍写入大String来讲解实现的过程。

应用中很难评估一个String的大小,在编码的时候一般会根据String.Length*6来分配一个byte[]用来处理编码(这个6可以根据具体编码来定,这里定义6是确保的所有情况都能满足需求,实际上Encoding类有计算,只是过程处理复杂度感觉过高所以直接定最大编码值了),然后把String编码到对应的byte[]再分批次copy的Socket buffer中发送出去,这种做法就是使用一个大的连续内存块写并复制。而接下来介绍的是直接把String编码到多个非连续的Socket buffer块中然后直接发送,这样就可以节省大块内存的复制来提高效率了。

下面通过代码来介绍BeetleX是怎处理这个过程的

public int WriteString(string value, Encoding coding = ){
if (!string.IsOrEmpty(value)) { coding = coding ?? Encoding.UTF8; if (WriteSequenceNetStream != ) { ReadOnlySpan<char> spanValue = value; int result = 0; while (spanValue.Length > 0) { ReadOnlySpan<char> chars; Span<byte> span; span = WriteSequenceNetStream.GetWriteSpan(2048); int encodeLen = span.Length / 6;
chars = spanValue.Slice(0, spanValue.Length > encodeLen ? encodeLen : spanValue.Length);
var len = coding.GetBytes(chars, span); WriteSequenceNetStream.WriteAdvance(len); result += len; spanValue = spanValue.Slice(len); } return result; } else { var len = Stream.Write(value, coding); return len; } } return 0;}

具体代码是循环分批写入,先向数据流申请2K的空间(实际情况有可能没有2K,后面会贴相关代码),然后根据分配的内存长度再计算出需要编码的字符长度然后分批写入;写入后通过WriteAdvance(len)提交实际写入块的长度。接下来看一下这个预分本的存是怎样操作的

 public Memory<byte> GetMemory(int length) {
if (_end == ) { CreateMemory(length); } int availableSize = _end.AvailableSize; if (availableSize < length && availableSize < 256) CreateMemory(length); return _end.Allot(length);
}

在非连续内存块的链表分配指定长度的内存,当前块可用空间不够并少于256个字节空间就重新创建一个新的内存块,从分配策略上来说并不是每一块都能完全写满,但这个并不重要因为每个内存块都有记录位置偏移,在Socket发送的时候直接针对偏移发就好了。当数据写入到多个小内存块后就可以把这个链表递归发送出去了

internal async Task SendToSocket(MemoryBlock segment, bool begin){ if (segment == ) return; try { var buffer = segment.GetUseMemory(); if (buffer.Length != 0) {
var len = await Socket.SendAsync(buffer); SocketProcessHandler?.SendCompeted(this, buffer, len); SencCompleted(len); GetLoger(LogLevel.Debug)?.Write(this, "NetClient", "SendData", $"Length {len}"); GetLoger(LogLevel.Trace)?.Write(this, "NetClient", " SendData", $"{Convert.ToHexString(buffer.Slice(0, len).Span)}"); if (len != buffer.Length) GetLoger(LogLevel.Error)?.Write(this, "NetClient", "SendData", $"Buffer length {buffer.Length} completed {len}"); await SendToSocket(segment.Next, false); } } catch (Exception e_) { GetLoger(Logs.LogLevel.Error)?.WriteException(this, "NetClient", "SendData", e_); Disconnect(e_);
} finally { if (begin) { while (segment != ) { var next = segment.Next; segment.Dispose(); segment = next; } } }}

发送完成后把链表的内存回归到内存池中。

通过以上方法就可以实现一个基于动态非连续内存块的Stream,它的好处是无论怎么扩容都不会产生内存复制,内存通过内存池管理也不怕创建和扩展导致新内存开销!其实这个Stream在BeetleX源码中已经实现并支持SslStream.具体可以去查看项目源码


BeetleX

开源跨平台通讯框架(支持TLS)

提供HTTP,Websocket,MQTT,Redis,RPC和服务网关开源组件

个人微信:henryfan128 QQ:28304340

https://github.com/beetlex-io/





相关推荐

「网络安全」JAVA代码审计——XXE外部实体注入

一、WEB安全部分想要了解XXE,在那之前需要了解XML的相关基础二、XML基础...

Web前端面试题目及答案汇总(web前端面试题最新)

Web前端面试题目及答案汇总来源:极客头条以下是收集一些面试中经常会遇到的经典面试题以及自己面试过程中无法解决的问题,通过对知识的整理以及经验的总结,重新巩固自身的前端基础知识,如有错误或更好的答案,...

什么是脚本文件?与可执行文件有什么不同?

今天的内容是脚本文件和可执行文件是两种不同类型的计算机文件,它们在结构和执行方式上有显著区别。脚本文件:定义与特性...

20个实用Python运维脚本(收藏级)(python 运维工具)

系统环境:支持Linux(Ubuntu/CentOS/Debian)和Windows...

2026年前每个开发者都应该学习的技能

优秀开发者...

Linux 如何每 5、10、15 或 30 分钟运行一次 Cron 作业?

在Linux系统中,Cron是一个强大的工具,用于自动化重复性任务。通过合理配置...

Shell脚本编程进阶实战:从入门到高效自动化

Shell脚本编程进阶实战:从入门到高效自动化一、参数处理进阶:打造专业级CLI工具1.高级参数解析示例...

在Bash中按分隔符拆分字符串的方法

技术背景在Bash脚本编程中,经常会遇到需要按特定分隔符拆分字符串的需求,例如处理CSV文件、解析日志等。掌握字符串拆分的方法对于数据处理和脚本自动化非常重要。...

程序员用5分钟,把一个400多MB的苹果安装包削掉了187MB

丰色发自凹非寺量子位|公众号QbitAI前些日子,一个...

如何在 Windows 上编写批处理脚本

你知道如何使用命令提示符吗?如果这样做,您可以编写一个批处理文件。在最简单的形式中,批处理文件(或批处理脚本)是双击文件时执行的几个命令的列表。批处理文件一直回到DOS,但仍然适用于现代版本的Win...

一文搞懂shell脚本(shell脚本应用实战)

一文搞懂shell脚本1、shell脚本介绍什么是shell脚本...

一文讲清ShellScript脚本编程知识

摘要:本文详尽地讲述了ShellScript的基础内容,还有它在Linux系统里的运用情况,涵盖了它的基本语法、常用的命令以及高级的功能。ShellScript可是一种简单又非常实用的编...

在Bash脚本中获取自身所在目录的方法

技术背景在使用Bash脚本时,有时需要获取脚本自身所在的目录。比如,当脚本作为另一个应用程序的启动器时,需要将工作目录更改为脚本所在的目录,以便对该目录中的文件进行操作。然而,由于脚本的调用方式多样(...

shell中如何确定脚本的位置?这篇文章告诉你

我想从同一个位置读取一些配置文件,如何确定脚本的位置?。这个问题的出现主要是由两个原因引发的:一是您希望将脚本的数据或配置进行外部化,因此需要一种方式来寻找这些外部资源;二是您的脚本需要对某些捆绑资源...

bash shell 语法(bash命令用法)

下面是**Shell(Bash)语法的常用知识点总结**,适合初学者和日常脚本编写参考。内容涵盖变量、判断、循环、函数、重定向、正则、数组等常见用法。---#Shell(Bash)语法速查总结...