Posts by Tao Bu

Long-Context Attention Benchmark

19 October 2025

From Kernel Efficiency to Distributed Scalability

Read more ...

MagiAttention

21 April 2025

A Distributed Attention Towards Linear Scalability for Ultra-Long Context, Heterogeneous Mask Training

Read more ...