[nihav.git] / nihav-realmedia / src / codecs / rv40enc / dsp / mc.rs

use nihav_core::frame::NAVideoBuffer;
use nihav_codec_support::codecs::MV;
use nihav_codec_support::codecs::blockdsp::edge_emu;
use super::clip8;

pub fn luma_mc(dst: &mut [u8], dstride: usize, pic: &NAVideoBuffer<u8>, xpos: usize, ypos: usize, mv: MV, is16: bool) {
    const RV40_EDGE1: [isize; 4] = [ 0, 2, 2, 2 ];
    const RV40_EDGE2: [isize; 4] = [ 0, 3, 3, 3 ];
    let dx = mv.x >> 2;
    let cx = (mv.x & 3) as usize;
    let dy = mv.y >> 2;
    let cy = (mv.y & 3) as usize;
    let mode = cx + cy * 4;

    let (w_, h_) = pic.get_dimensions(0);
    let w = (w_ + 15) & !15;
    let h = (h_ + 15) & !15;
    let (bsize, mc_func) = if is16 { (16, LUMA_MC_16[mode]) } else { (8, LUMA_MC_8[mode]) };

    if check_pos(xpos, ypos, bsize, w, h, dx, dy, RV40_EDGE1[cx], RV40_EDGE2[cx], RV40_EDGE1[cy], RV40_EDGE2[cy]) {
        let sstride = pic.get_stride(0);
        let mut soffset = pic.get_offset(0) + xpos + ypos * sstride;
        let data = pic.get_data();
        let src: &[u8] = data.as_slice();
        soffset = ((soffset as isize) + (dx as isize) + (dy as isize) * (sstride as isize)) as usize;
        (mc_func)(dst, dstride, src, soffset, sstride);
    } else {
        let mut ebuf = [0u8; 32 * 22];
        edge_emu(pic, (xpos as isize) + (dx as isize) - 2, (ypos as isize) + (dy as isize) - 2, 16+5, 16+5, &mut ebuf, 32, 0, 4);
        (mc_func)(dst, dstride, &ebuf, 32 * 2 + 2, 32);
    }
}

pub fn chroma_mc(dst: &mut [u8], dstride: usize, pic: &NAVideoBuffer<u8>, xpos: usize, ypos: usize, comp: usize, mv: MV, is16: bool) {
    let mvx = mv.x / 2;
    let mvy = mv.y / 2;
    let dx = mvx >> 2;
    let mut cx = (mvx & 3) as usize;
    let dy = mvy >> 2;
    let mut cy = (mvy & 3) as usize;

    if (cx == 3) && (cy == 3) {
        cx = 2;
        cy = 2;
    }

    let (w_, h_) = pic.get_dimensions(0);
    let w = ((w_ + 15) & !15) >> 1;
    let h = ((h_ + 15) & !15) >> 1;
    let bsize = if is16 { 8 } else { 4 };

    if check_pos(xpos, ypos, bsize, w, h, dx, dy, 0, 1, 0, 1) {
        let sstride = pic.get_stride(comp);
        let mut soffset = pic.get_offset(comp) + xpos + ypos * sstride;
        let data = pic.get_data();
        let src: &[u8] = data.as_slice();
        soffset = ((soffset as isize) + (dx as isize) + (dy as isize) * (sstride as isize)) as usize;
        rv40_chroma_mc(dst, dstride, src, soffset, sstride, bsize, cx, cy);
    } else {
        let mut ebuf = [0u8; 16 * 10];
        edge_emu(pic, (xpos as isize) + (dx as isize), (ypos as isize) + (dy as isize), bsize + 1, bsize + 1, &mut ebuf, 16, comp, 4);
        rv40_chroma_mc(dst, dstride, &ebuf, 0, 16, bsize, cx, cy);
    }
}

fn check_pos(x: usize, y: usize, size: usize, width: usize, height: usize, dx: i16, dy: i16, e0: isize, e1: isize, e2: isize, e3: isize) -> bool {
    let xn = (x as isize) + (dx as isize);
    let yn = (y as isize) + (dy as isize);

    (xn - e0 >= 0) && (xn + (size as isize) + e1 <= (width as isize)) && (yn - e2 >= 0) && (yn + (size as isize) + e3 <= (height as isize))
}

type MCFunc = fn (&mut [u8], usize, &[u8], usize, usize);

macro_rules! el {
    ($s: ident, $o: expr) => ( $s[$o] as i16 )
}

macro_rules! filter {
    (01; $s: ident, $o: expr, $step: expr) => (
            clip8(((      el!($s, $o - 2 * $step)
                     -5 * el!($s, $o - 1 * $step)
                    +52 * el!($s, $o - 0 * $step)
                    +20 * el!($s, $o + 1 * $step)
                     -5 * el!($s, $o + 2 * $step)
                        + el!($s, $o + 3 * $step) + 32) >> 6) as i16)
        );
    (02; $s: ident, $o: expr, $step: expr) => (
            clip8(((      el!($s, $o - 2 * $step)
                     -5 * el!($s, $o - 1 * $step)
                    +20 * el!($s, $o - 0 * $step)
                    +20 * el!($s, $o + 1 * $step)
                     -5 * el!($s, $o + 2 * $step)
                        + el!($s, $o + 3 * $step) + 16) >> 5) as i16)
        );
    (03; $s: ident, $o: expr, $step: expr) => (
            clip8(((      el!($s, $o - 2 * $step)
                     -5 * el!($s, $o - 1 * $step)
                    +20 * el!($s, $o - 0 * $step)
                    +52 * el!($s, $o + 1 * $step)
                     -5 * el!($s, $o + 2 * $step)
                        + el!($s, $o + 3 * $step) + 32) >> 6) as i16)
        );
    (33; $s: ident, $o: expr, $stride: expr) => (
            clip8(((  el!($s, $o)
                    + el!($s, $o + 1)
                    + el!($s, $o + $stride)
                    + el!($s, $o + 1 + $stride) + 2) >> 2) as i16)
        );
}

macro_rules! mc_func {
    (copy; $name: ident, $size: expr) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], sidx: usize, sstride: usize) {
            for (dline, sline) in dst.chunks_mut(dstride).zip(src[sidx..].chunks(sstride)).take($size) {
                dline[..$size].copy_from_slice(&sline[..$size]);
            }
        }
        );
    (mc01; $name: ident, $size: expr, $ver: expr) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
            let step = if $ver { sstride } else { 1 };
            for dline in dst.chunks_mut(dstride).take($size) {
                for (x, el) in dline[..$size].iter_mut().enumerate() {
                    *el = filter!(01; src, sidx + x, step);
                }
                sidx += sstride;
            }
        }
        );
    (mc02; $name: ident, $size: expr, $ver: expr) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
            let step = if $ver { sstride } else { 1 };
            for dline in dst.chunks_mut(dstride).take($size) {
                for (x, el) in dline[..$size].iter_mut().enumerate() {
                    *el = filter!(02; src, sidx + x, step);
                }
                sidx += sstride;
            }
        }
        );
    (mc03; $name: ident, $size: expr, $ver: expr) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
            let step = if $ver { sstride } else { 1 };
            for dline in dst.chunks_mut(dstride).take($size) {
                for (x, el) in dline[..$size].iter_mut().enumerate() {
                    *el = filter!(03; src, sidx + x, step);
                }
                sidx += sstride;
            }
        }
        );
    (cm01; $name: ident, $size: expr, $ofilt: ident) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
            let mut buf: [u8; ($size + 5) * $size] = [0; ($size + 5) * $size];
            let mut bidx = 0;
            let bstride = $size;
            sidx -= sstride * 2;
            for _ in 0..$size+5 {
                for x in 0..$size { buf[bidx + x] = filter!(01; src, sidx + x, 1); }
                bidx += bstride;
                sidx += sstride;
            }
            $ofilt(dst, dstride, &buf, 2*bstride, $size);
        }
        );
    (cm02; $name: ident, $size: expr, $ofilt: ident) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
            let mut buf: [u8; ($size + 5) * $size] = [0; ($size + 5) * $size];
            let mut bidx = 0;
            let bstride = $size;
            sidx -= sstride * 2;
            for _ in 0..$size+5 {
                for x in 0..$size { buf[bidx + x] = filter!(02; src, sidx + x, 1); }
                bidx += bstride;
                sidx += sstride;
            }
            $ofilt(dst, dstride, &buf, 2*bstride, $size);
        }
        );
    (cm03; $name: ident, $size: expr, $ofilt: ident) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
            let mut buf: [u8; ($size + 5) * $size] = [0; ($size + 5) * $size];
            let mut bidx = 0;
            let bstride = $size;
            sidx -= sstride * 2;
            for _ in 0..$size+5 {
                for x in 0..$size { buf[bidx + x] = filter!(03; src, sidx + x, 1); }
                bidx += bstride;
                sidx += sstride;
            }
            $ofilt(dst, dstride, &buf, 2*bstride, $size);
        }
        );
    (mc33; $name: ident, $size: expr) => (
        fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
            for dline in dst.chunks_mut(dstride).take($size) {
                for (x, el) in dline[..$size].iter_mut().enumerate() {
                    *el = filter!(33; src, sidx + x, sstride);
                }
                sidx += sstride;
            }
        }
        );
}
mc_func!(copy; copy_16, 16);
mc_func!(copy; copy_8,   8);
mc_func!(mc01; luma_mc_10_16, 16, false);
mc_func!(mc01; luma_mc_10_8,   8, false);
mc_func!(mc02; luma_mc_20_16, 16, false);
mc_func!(mc02; luma_mc_20_8,   8, false);
mc_func!(mc03; luma_mc_30_16, 16, false);
mc_func!(mc03; luma_mc_30_8,   8, false);
mc_func!(mc01; luma_mc_01_16, 16, true);
mc_func!(mc01; luma_mc_01_8,   8, true);
mc_func!(mc02; luma_mc_02_16, 16, true);
mc_func!(mc02; luma_mc_02_8,   8, true);
mc_func!(mc03; luma_mc_03_16, 16, true);
mc_func!(mc03; luma_mc_03_8,   8, true);
mc_func!(cm01; luma_mc_11_16, 16, luma_mc_01_16);
mc_func!(cm01; luma_mc_11_8,   8, luma_mc_01_8);
mc_func!(cm01; luma_mc_12_16, 16, luma_mc_02_16);
mc_func!(cm01; luma_mc_12_8,   8, luma_mc_02_8);
mc_func!(cm01; luma_mc_13_16, 16, luma_mc_03_16);
mc_func!(cm01; luma_mc_13_8,   8, luma_mc_03_8);
mc_func!(cm02; luma_mc_21_16, 16, luma_mc_01_16);
mc_func!(cm02; luma_mc_21_8,   8, luma_mc_01_8);
mc_func!(cm02; luma_mc_22_16, 16, luma_mc_02_16);
mc_func!(cm02; luma_mc_22_8,   8, luma_mc_02_8);
mc_func!(cm02; luma_mc_23_16, 16, luma_mc_03_16);
mc_func!(cm02; luma_mc_23_8,   8, luma_mc_03_8);
mc_func!(cm03; luma_mc_31_16, 16, luma_mc_01_16);
mc_func!(cm03; luma_mc_31_8,   8, luma_mc_01_8);
mc_func!(cm03; luma_mc_32_16, 16, luma_mc_02_16);
mc_func!(cm03; luma_mc_32_8,   8, luma_mc_02_8);
mc_func!(mc33; luma_mc_33_16, 16);
mc_func!(mc33; luma_mc_33_8,   8);

const LUMA_MC_16: [MCFunc; 16] = [
    copy_16,       luma_mc_10_16,  luma_mc_20_16, luma_mc_30_16,
    luma_mc_01_16, luma_mc_11_16,  luma_mc_21_16, luma_mc_31_16,
    luma_mc_02_16, luma_mc_12_16,  luma_mc_22_16, luma_mc_32_16,
    luma_mc_03_16, luma_mc_13_16,  luma_mc_23_16, luma_mc_33_16
];
const LUMA_MC_8: [MCFunc; 16] = [
    copy_8,        luma_mc_10_8,   luma_mc_20_8,  luma_mc_30_8,
    luma_mc_01_8,  luma_mc_11_8,   luma_mc_21_8,  luma_mc_31_8,
    luma_mc_02_8,  luma_mc_12_8,   luma_mc_22_8,  luma_mc_32_8,
    luma_mc_03_8,  luma_mc_13_8,   luma_mc_23_8,  luma_mc_33_8
];

#[allow(clippy::many_single_char_names)]
fn rv40_chroma_mc(dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize, size: usize, x: usize, y: usize) {
    const RV40_CHROMA_BIAS: [[u16; 4]; 4] = [
        [ 0, 4, 8, 4 ],
        [ 8, 7, 8, 7 ],
        [ 0, 8, 4, 8 ],
        [ 8, 7, 8, 7 ]
    ];

    if (x == 0) && (y == 0) {
        for (dline, sline) in dst.chunks_mut(dstride).zip(src[sidx..].chunks(sstride)).take(size) {
            dline[..size].copy_from_slice(&sline[..size]);
        }
        return;
    }
    let bias = RV40_CHROMA_BIAS[y >> 1][x >> 1];
    if (x > 0) && (y > 0) {
        let a = ((4 - x) * (4 - y)) as u16;
        let b = ((    x) * (4 - y)) as u16;
        let c = ((4 - x) * (    y)) as u16;
        let d = ((    x) * (    y)) as u16;
        for dline in dst.chunks_mut(dstride).take(size) {
            for (x, el) in dline[..size].iter_mut().enumerate() {
                *el = ((a * (src[sidx + x] as u16)
                      + b * (src[sidx + x + 1] as u16)
                      + c * (src[sidx + x + sstride] as u16)
                      + d * (src[sidx + x + 1 + sstride] as u16) + bias) >> 4) as u8;
            }
            sidx += sstride;
        }
    } else {
        let a = ((4 - x) * (4 - y)) as u16;
        let e = ((    x) * (4 - y) + (4 - x) * (    y)) as u16;
        let step = if y > 0 { sstride } else { 1 };
        for dline in dst.chunks_mut(dstride).take(size) {
            for (x, el) in dline[..size].iter_mut().enumerate() {
                *el = ((a * (src[sidx + x] as u16)
                      + e * (src[sidx + x + step] as u16) + bias) >> 4) as u8;
            }
            sidx += sstride;
        }
    }
}
Commit	Line	Data
4965a5e5 KS	1	use nihav_core::frame::NAVideoBuffer;
	2	use nihav_codec_support::codecs::MV;
	3	use nihav_codec_support::codecs::blockdsp::edge_emu;
	4	use super::clip8;
	5
	6	pub fn luma_mc(dst: &mut [u8], dstride: usize, pic: &NAVideoBuffer<u8>, xpos: usize, ypos: usize, mv: MV, is16: bool) {
	7	const RV40_EDGE1: [isize; 4] = [ 0, 2, 2, 2 ];
	8	const RV40_EDGE2: [isize; 4] = [ 0, 3, 3, 3 ];
	9	let dx = mv.x >> 2;
	10	let cx = (mv.x & 3) as usize;
	11	let dy = mv.y >> 2;
	12	let cy = (mv.y & 3) as usize;
	13	let mode = cx + cy * 4;
	14
	15	let (w_, h_) = pic.get_dimensions(0);
	16	let w = (w_ + 15) & !15;
	17	let h = (h_ + 15) & !15;
	18	let (bsize, mc_func) = if is16 { (16, LUMA_MC_16[mode]) } else { (8, LUMA_MC_8[mode]) };
	19
	20	if check_pos(xpos, ypos, bsize, w, h, dx, dy, RV40_EDGE1[cx], RV40_EDGE2[cx], RV40_EDGE1[cy], RV40_EDGE2[cy]) {
	21	let sstride = pic.get_stride(0);
	22	let mut soffset = pic.get_offset(0) + xpos + ypos * sstride;
	23	let data = pic.get_data();
	24	let src: &[u8] = data.as_slice();
	25	soffset = ((soffset as isize) + (dx as isize) + (dy as isize) * (sstride as isize)) as usize;
	26	(mc_func)(dst, dstride, src, soffset, sstride);
	27	} else {
	28	let mut ebuf = [0u8; 32 * 22];
	29	edge_emu(pic, (xpos as isize) + (dx as isize) - 2, (ypos as isize) + (dy as isize) - 2, 16+5, 16+5, &mut ebuf, 32, 0, 4);
	30	(mc_func)(dst, dstride, &ebuf, 32 * 2 + 2, 32);
	31	}
	32	}
	33
	34	pub fn chroma_mc(dst: &mut [u8], dstride: usize, pic: &NAVideoBuffer<u8>, xpos: usize, ypos: usize, comp: usize, mv: MV, is16: bool) {
	35	let mvx = mv.x / 2;
	36	let mvy = mv.y / 2;
	37	let dx = mvx >> 2;
	38	let mut cx = (mvx & 3) as usize;
	39	let dy = mvy >> 2;
	40	let mut cy = (mvy & 3) as usize;
	41
	42	if (cx == 3) && (cy == 3) {
	43	cx = 2;
	44	cy = 2;
	45	}
	46
	47	let (w_, h_) = pic.get_dimensions(0);
	48	let w = ((w_ + 15) & !15) >> 1;
	49	let h = ((h_ + 15) & !15) >> 1;
	50	let bsize = if is16 { 8 } else { 4 };
	51
	52	if check_pos(xpos, ypos, bsize, w, h, dx, dy, 0, 1, 0, 1) {
	53	let sstride = pic.get_stride(comp);
	54	let mut soffset = pic.get_offset(comp) + xpos + ypos * sstride;
	55	let data = pic.get_data();
	56	let src: &[u8] = data.as_slice();
	57	soffset = ((soffset as isize) + (dx as isize) + (dy as isize) * (sstride as isize)) as usize;
	58	rv40_chroma_mc(dst, dstride, src, soffset, sstride, bsize, cx, cy);
	59	} else {
	60	let mut ebuf = [0u8; 16 * 10];
	61	edge_emu(pic, (xpos as isize) + (dx as isize), (ypos as isize) + (dy as isize), bsize + 1, bsize + 1, &mut ebuf, 16, comp, 4);
	62	rv40_chroma_mc(dst, dstride, &ebuf, 0, 16, bsize, cx, cy);
	63	}
	64	}
65
66	fn check_pos(x: usize, y: usize, size: usize, width: usize, height: usize, dx: i16, dy: i16, e0: isize, e1: isize, e2: isize, e3: isize) -> bool {
67	let xn = (x as isize) + (dx as isize);
68	let yn = (y as isize) + (dy as isize);
69
70	(xn - e0 >= 0) && (xn + (size as isize) + e1 <= (width as isize)) && (yn - e2 >= 0) && (yn + (size as isize) + e3 <= (height as isize))
71	}
72
73	type MCFunc = fn (&mut [u8], usize, &[u8], usize, usize);
74
75	macro_rules! el {
76	($s: ident, $o: expr) => ( $s[$o] as i16 )
77	}
78
79	macro_rules! filter {
80	(01; $s: ident, $o: expr, $step: expr) => (
81	clip8((( el!($s, $o - 2 * $step)
82	-5 * el!($s, $o - 1 * $step)
83	+52 * el!($s, $o - 0 * $step)
84	+20 * el!($s, $o + 1 * $step)
85	-5 * el!($s, $o + 2 * $step)
86	+ el!($s, $o + 3 * $step) + 32) >> 6) as i16)
87	);
88	(02; $s: ident, $o: expr, $step: expr) => (
89	clip8((( el!($s, $o - 2 * $step)
90	-5 * el!($s, $o - 1 * $step)
91	+20 * el!($s, $o - 0 * $step)
92	+20 * el!($s, $o + 1 * $step)
93	-5 * el!($s, $o + 2 * $step)
94	+ el!($s, $o + 3 * $step) + 16) >> 5) as i16)
95	);
96	(03; $s: ident, $o: expr, $step: expr) => (
97	clip8((( el!($s, $o - 2 * $step)
98	-5 * el!($s, $o - 1 * $step)
99	+20 * el!($s, $o - 0 * $step)
100	+52 * el!($s, $o + 1 * $step)
101	-5 * el!($s, $o + 2 * $step)
102	+ el!($s, $o + 3 * $step) + 32) >> 6) as i16)
103	);
104	(33; $s: ident, $o: expr, $stride: expr) => (
105	clip8((( el!($s, $o)
106	+ el!($s, $o + 1)
107	+ el!($s, $o + $stride)
108	+ el!($s, $o + 1 + $stride) + 2) >> 2) as i16)
109	);
110	}
111
112	macro_rules! mc_func {
113	(copy; $name: ident, $size: expr) => (
114	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], sidx: usize, sstride: usize) {
115	for (dline, sline) in dst.chunks_mut(dstride).zip(src[sidx..].chunks(sstride)).take($size) {
116	dline[..$size].copy_from_slice(&sline[..$size]);
117	}
118	}
119	);
120	(mc01; $name: ident, $size: expr, $ver: expr) => (
121	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
122	let step = if $ver { sstride } else { 1 };
123	for dline in dst.chunks_mut(dstride).take($size) {
124	for (x, el) in dline[..$size].iter_mut().enumerate() {
125	*el = filter!(01; src, sidx + x, step);
126	}
127	sidx += sstride;
128	}
129	}
130	);
131	(mc02; $name: ident, $size: expr, $ver: expr) => (
132	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
133	let step = if $ver { sstride } else { 1 };
134	for dline in dst.chunks_mut(dstride).take($size) {
135	for (x, el) in dline[..$size].iter_mut().enumerate() {
136	*el = filter!(02; src, sidx + x, step);
137	}
138	sidx += sstride;
139	}
140	}
141	);
142	(mc03; $name: ident, $size: expr, $ver: expr) => (
143	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
144	let step = if $ver { sstride } else { 1 };
145	for dline in dst.chunks_mut(dstride).take($size) {
146	for (x, el) in dline[..$size].iter_mut().enumerate() {
147	*el = filter!(03; src, sidx + x, step);
148	}
149	sidx += sstride;
150	}
151	}
152	);
153	(cm01; $name: ident, $size: expr, $ofilt: ident) => (
154	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
155	let mut buf: [u8; ($size + 5) * $size] = [0; ($size + 5) * $size];
156	let mut bidx = 0;
157	let bstride = $size;
158	sidx -= sstride * 2;
159	for _ in 0..$size+5 {
160	for x in 0..$size { buf[bidx + x] = filter!(01; src, sidx + x, 1); }
161	bidx += bstride;
162	sidx += sstride;
163	}
164	$ofilt(dst, dstride, &buf, 2*bstride, $size);
165	}
166	);
167	(cm02; $name: ident, $size: expr, $ofilt: ident) => (
168	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
169	let mut buf: [u8; ($size + 5) * $size] = [0; ($size + 5) * $size];
170	let mut bidx = 0;
171	let bstride = $size;
172	sidx -= sstride * 2;
173	for _ in 0..$size+5 {
174	for x in 0..$size { buf[bidx + x] = filter!(02; src, sidx + x, 1); }
175	bidx += bstride;
176	sidx += sstride;
177	}
178	$ofilt(dst, dstride, &buf, 2*bstride, $size);
179	}
180	);
181	(cm03; $name: ident, $size: expr, $ofilt: ident) => (
182	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
183	let mut buf: [u8; ($size + 5) * $size] = [0; ($size + 5) * $size];
184	let mut bidx = 0;
185	let bstride = $size;
186	sidx -= sstride * 2;
187	for _ in 0..$size+5 {
188	for x in 0..$size { buf[bidx + x] = filter!(03; src, sidx + x, 1); }
189	bidx += bstride;
190	sidx += sstride;
191	}
192	$ofilt(dst, dstride, &buf, 2*bstride, $size);
193	}
194	);
195	(mc33; $name: ident, $size: expr) => (
196	fn $name (dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize) {
197	for dline in dst.chunks_mut(dstride).take($size) {
198	for (x, el) in dline[..$size].iter_mut().enumerate() {
199	*el = filter!(33; src, sidx + x, sstride);
200	}
201	sidx += sstride;
202	}
203	}
204	);
205	}
206	mc_func!(copy; copy_16, 16);
207	mc_func!(copy; copy_8, 8);
208	mc_func!(mc01; luma_mc_10_16, 16, false);
209	mc_func!(mc01; luma_mc_10_8, 8, false);
210	mc_func!(mc02; luma_mc_20_16, 16, false);
211	mc_func!(mc02; luma_mc_20_8, 8, false);
212	mc_func!(mc03; luma_mc_30_16, 16, false);
213	mc_func!(mc03; luma_mc_30_8, 8, false);
214	mc_func!(mc01; luma_mc_01_16, 16, true);
215	mc_func!(mc01; luma_mc_01_8, 8, true);
216	mc_func!(mc02; luma_mc_02_16, 16, true);
217	mc_func!(mc02; luma_mc_02_8, 8, true);
218	mc_func!(mc03; luma_mc_03_16, 16, true);
219	mc_func!(mc03; luma_mc_03_8, 8, true);
220	mc_func!(cm01; luma_mc_11_16, 16, luma_mc_01_16);
221	mc_func!(cm01; luma_mc_11_8, 8, luma_mc_01_8);
222	mc_func!(cm01; luma_mc_12_16, 16, luma_mc_02_16);
223	mc_func!(cm01; luma_mc_12_8, 8, luma_mc_02_8);
224	mc_func!(cm01; luma_mc_13_16, 16, luma_mc_03_16);
225	mc_func!(cm01; luma_mc_13_8, 8, luma_mc_03_8);
226	mc_func!(cm02; luma_mc_21_16, 16, luma_mc_01_16);
227	mc_func!(cm02; luma_mc_21_8, 8, luma_mc_01_8);
228	mc_func!(cm02; luma_mc_22_16, 16, luma_mc_02_16);
229	mc_func!(cm02; luma_mc_22_8, 8, luma_mc_02_8);
230	mc_func!(cm02; luma_mc_23_16, 16, luma_mc_03_16);
231	mc_func!(cm02; luma_mc_23_8, 8, luma_mc_03_8);
232	mc_func!(cm03; luma_mc_31_16, 16, luma_mc_01_16);
233	mc_func!(cm03; luma_mc_31_8, 8, luma_mc_01_8);
234	mc_func!(cm03; luma_mc_32_16, 16, luma_mc_02_16);
235	mc_func!(cm03; luma_mc_32_8, 8, luma_mc_02_8);
236	mc_func!(mc33; luma_mc_33_16, 16);
237	mc_func!(mc33; luma_mc_33_8, 8);
238
239	const LUMA_MC_16: [MCFunc; 16] = [
240	copy_16, luma_mc_10_16, luma_mc_20_16, luma_mc_30_16,
241	luma_mc_01_16, luma_mc_11_16, luma_mc_21_16, luma_mc_31_16,
242	luma_mc_02_16, luma_mc_12_16, luma_mc_22_16, luma_mc_32_16,
243	luma_mc_03_16, luma_mc_13_16, luma_mc_23_16, luma_mc_33_16
244	];
245	const LUMA_MC_8: [MCFunc; 16] = [
246	copy_8, luma_mc_10_8, luma_mc_20_8, luma_mc_30_8,
247	luma_mc_01_8, luma_mc_11_8, luma_mc_21_8, luma_mc_31_8,
248	luma_mc_02_8, luma_mc_12_8, luma_mc_22_8, luma_mc_32_8,
249	luma_mc_03_8, luma_mc_13_8, luma_mc_23_8, luma_mc_33_8
250	];
251
252	#[allow(clippy::many_single_char_names)]
253	fn rv40_chroma_mc(dst: &mut [u8], dstride: usize, src: &[u8], mut sidx: usize, sstride: usize, size: usize, x: usize, y: usize) {
254	const RV40_CHROMA_BIAS: [[u16; 4]; 4] = [
255	[ 0, 4, 8, 4 ],
256	[ 8, 7, 8, 7 ],
257	[ 0, 8, 4, 8 ],
258	[ 8, 7, 8, 7 ]
259	];
260
261	if (x == 0) && (y == 0) {
262	for (dline, sline) in dst.chunks_mut(dstride).zip(src[sidx..].chunks(sstride)).take(size) {
263	dline[..size].copy_from_slice(&sline[..size]);
264	}
265	return;
266	}
267	let bias = RV40_CHROMA_BIAS[y >> 1][x >> 1];
268	if (x > 0) && (y > 0) {
269	let a = ((4 - x) * (4 - y)) as u16;
270	let b = (( x) * (4 - y)) as u16;
271	let c = ((4 - x) * ( y)) as u16;
272	let d = (( x) * ( y)) as u16;
273	for dline in dst.chunks_mut(dstride).take(size) {
274	for (x, el) in dline[..size].iter_mut().enumerate() {
275	el = ((a (src[sidx + x] as u16)
276	+ b * (src[sidx + x + 1] as u16)
277	+ c * (src[sidx + x + sstride] as u16)
278	+ d * (src[sidx + x + 1 + sstride] as u16) + bias) >> 4) as u8;
279	}
280	sidx += sstride;
281	}
282	} else {
283	let a = ((4 - x) * (4 - y)) as u16;
284	let e = (( x) * (4 - y) + (4 - x) * ( y)) as u16;
285	let step = if y > 0 { sstride } else { 1 };
286	for dline in dst.chunks_mut(dstride).take(size) {
287	for (x, el) in dline[..size].iter_mut().enumerate() {
288	el = ((a (src[sidx + x] as u16)
289	+ e * (src[sidx + x + step] as u16) + bias) >> 4) as u8;
290	}
291	sidx += sstride;
292	}
293	}
294	}