| /* GENmemcpy.S: Generic sparc64 memcpy. |
| * |
| * Copyright (C) 2007 David S. Miller (davem@davemloft.net) |
| */ |
| |
| #ifdef __KERNEL__ |
| #define GLOBAL_SPARE %g7 |
| #else |
| #define GLOBAL_SPARE %g5 |
| #endif |
| |
| #ifndef EX_LD |
| #define EX_LD(x) x |
| #endif |
| |
| #ifndef EX_ST |
| #define EX_ST(x) x |
| #endif |
| |
| #ifndef EX_RETVAL |
| #define EX_RETVAL(x) x |
| #endif |
| |
| #ifndef LOAD |
| #define LOAD(type,addr,dest) type [addr], dest |
| #endif |
| |
| #ifndef STORE |
| #define STORE(type,src,addr) type src, [addr] |
| #endif |
| |
| #ifndef FUNC_NAME |
| #define FUNC_NAME GENmemcpy |
| #endif |
| |
| #ifndef PREAMBLE |
| #define PREAMBLE |
| #endif |
| |
| #ifndef XCC |
| #define XCC xcc |
| #endif |
| |
| .register %g2,#scratch |
| .register %g3,#scratch |
| |
| .text |
| .align 64 |
| |
| .globl FUNC_NAME |
| .type FUNC_NAME,#function |
| FUNC_NAME: /* %o0=dst, %o1=src, %o2=len */ |
| srlx %o2, 31, %g2 |
| cmp %g2, 0 |
| tne %XCC, 5 |
| PREAMBLE |
| mov %o0, GLOBAL_SPARE |
| |
| cmp %o2, 0 |
| be,pn %XCC, 85f |
| or %o0, %o1, %o3 |
| cmp %o2, 16 |
| blu,a,pn %XCC, 80f |
| or %o3, %o2, %o3 |
| |
| xor %o0, %o1, %o4 |
| andcc %o4, 0x7, %g0 |
| bne,a,pn %XCC, 90f |
| sub %o0, %o1, %o3 |
| |
| and %o0, 0x7, %o4 |
| sub %o4, 0x8, %o4 |
| sub %g0, %o4, %o4 |
| sub %o2, %o4, %o2 |
| 1: subcc %o4, 1, %o4 |
| EX_LD(LOAD(ldub, %o1, %g1)) |
| EX_ST(STORE(stb, %g1, %o0)) |
| add %o1, 1, %o1 |
| bne,pt %XCC, 1b |
| add %o0, 1, %o0 |
| |
| andn %o2, 0x7, %g1 |
| sub %o2, %g1, %o2 |
| 1: subcc %g1, 0x8, %g1 |
| EX_LD(LOAD(ldx, %o1, %g2)) |
| EX_ST(STORE(stx, %g2, %o0)) |
| add %o1, 0x8, %o1 |
| bne,pt %XCC, 1b |
| add %o0, 0x8, %o0 |
| |
| brz,pt %o2, 85f |
| sub %o0, %o1, %o3 |
| ba,a,pt %XCC, 90f |
| |
| .align 64 |
| 80: /* 0 < len <= 16 */ |
| andcc %o3, 0x3, %g0 |
| bne,pn %XCC, 90f |
| sub %o0, %o1, %o3 |
| |
| 1: |
| subcc %o2, 4, %o2 |
| EX_LD(LOAD(lduw, %o1, %g1)) |
| EX_ST(STORE(stw, %g1, %o1 + %o3)) |
| bgu,pt %XCC, 1b |
| add %o1, 4, %o1 |
| |
| 85: retl |
| mov EX_RETVAL(GLOBAL_SPARE), %o0 |
| |
| .align 32 |
| 90: |
| subcc %o2, 1, %o2 |
| EX_LD(LOAD(ldub, %o1, %g1)) |
| EX_ST(STORE(stb, %g1, %o1 + %o3)) |
| bgu,pt %XCC, 90b |
| add %o1, 1, %o1 |
| retl |
| mov EX_RETVAL(GLOBAL_SPARE), %o0 |
| |
| .size FUNC_NAME, .-FUNC_NAME |