Meta, Stanford Halve Byte LLM Inference Memory Bandwidth techgig.com