返回顶部
首页 > 资讯 > 精选 >如何在Go的汇编器中更高效地将全局数据加载到NEON寄存器?
  • 371
分享到

如何在Go的汇编器中更高效地将全局数据加载到NEON寄存器?

go语言 2024-02-12 20:02:00 371人浏览 八月长安
摘要

PHP小编百草为您带来了关于在Go的汇编器中如何更高效地将全局数据加载到NEON寄存器的解决方案。Go语言在底层使用汇编器来优化性能,而NEON寄存器是ARM架构中的一种特殊寄存器,用

PHP小编百草为您带来了关于在Go的汇编器中如何更高效地将全局数据加载到NEON寄存器的解决方案。Go语言在底层使用汇编器来优化性能,而NEON寄存器是ARM架构中的一种特殊寄存器,用于加速多媒体和信号处理操作。本文将介绍如何使用适当的指令和技巧,以提高数据加载到NEON寄存器的效率,从而优化Go程序的性能。让我们一起来看看吧!

问题内容

arm64 asm代码中有p256one全局数据作为示例:

DATA p256one<>+0x00(SB)/8, $0x0000000000000001
DATA p256one<>+0x08(SB)/8, $0xffffffff00000000
DATA p256one<>+0x10(SB)/8, $0xffffffffffffffff
DATA p256one<>+0x18(SB)/8, $0x00000000fffffffe

GLOBL p256one<>(SB), 8, $32

我需要将 p256one<>(SB) 加载到 V0 和 V1 寄存器中。目前我使用以下方法:

LDP p256one<>+0x00(SB), (R0, R1)
    LDP p256one<>+0x10(SB), (R2, R3)
    VMOV R0, V0.D[0]
    VMOV R1, V0.D[1]
    VMOV R2, V1.D[0]
    VMOV R3, V1.D[1]

这里总共使用了六个指令。我们知道我们可以加载内存数据,如下所示:

VLD1 (R0), [V0.B16, V1.B16]

但是我们似乎无法用同样的方法加载全局数据。

那么,在Go的汇编代码中是否有更高效的方式将全局数据加载到NEON寄存器中呢?

解决方法

尝试将地址加载到寄存器中,然后从该地址加载:

MOVD $p256one<>(SB), R0
    VLD1 (R0), [V0.B16, V1.B16]

以上就是如何在Go的汇编器中更高效地将全局数据加载到NEON寄存器?的详细内容,更多请关注编程网其它相关文章!

--结束END--

本文标题: 如何在Go的汇编器中更高效地将全局数据加载到NEON寄存器?

本文链接: https://lsjlt.com/news/563926.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作