Fast Multiply-add Operation with Quadruple Precision on SR11000/J2

Takahiro Nagai,Hitoshi Yoshida,Hisayasu Kuroda, Yasumasa Kanada

semanticscholar（2007）

引用 0|浏览0

暂无评分

摘要

並列計算機の性能向上や数値計算法の進展は,大規模科学技術計算における大きな鍵となっている. 特に浮動小数点数における演算においては,計算規模が増すに従ってより多くの計算量を必要とし, 計算誤差も増大する.そのために,倍精度演算より有効桁数が多い 4倍精度演算の必要性が高まってきており注目されている.4 倍精度数の表現には,倍精度浮動小数点数を 2 つ用いて表される 128 ビットデータ型があるが,SR11000モデル J2上の Hitachi最適化コンパイラにおいて,4倍精度演算は 2つの倍精度データ型を用いてソフトウェアによって実現されており,倍精度演算に比べより多くの計算回数を必要とする.そこで本研究では,SR11000 モデル J2 上の Hitachi 最適化コンパイラを用いて 4 倍精度演算を定量的に解析し,FMA 命令(Fused Multiply-Add)を用いて演算回数を削減することによって高速化を行い,最大で約 1.5 倍の高速な 4 倍精度積和演算を実現した.

查看译文

AI 理解论文

溯源树

样例

生成溯源树，研究论文发展脉络

Chat Paper

正在生成论文摘要