KonstantinSeurer/mesa

Commit Graph

Author	SHA1	Message	Date
Marek Olšák	4fd8171f64	radeonsi: print more stats for shader-db Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13966>	2021-12-11 20:07:35 +00:00
Marek Olšák	b3b2f97f2e	radeonsi: add Wave32 heuristics and shader profiles This generally works well. There are new cases that select Wave32, and there are shader profiles which adjust that. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13966>	2021-12-11 20:07:35 +00:00
Juan A. Suarez Romero	38c953e287	gallium: add new PIPE_CAP_IMAGE_STORE_FORMATTED This capability is enabled for drivers supporting formatless image writing in shader. Reviewed-by: Ilia Mirkin <imirkin@alum.mit.edu> Signed-off-by: Juan A. Suarez Romero <jasuarez@igalia.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13409>	2021-12-03 15:32:36 +00:00
Qiang Yu	fcc062235c	ci: remove egl-copy-buffers from fail list egl-copy-buffers test has been fixed for dri3. So remove it from broadcom and freedreno ci fail list to prevent the gitlab ci test fail: spec@egl 1.4@egl-copy-buffers,UnexpectedPass Also remove it from radeonsi ci fail list since I verified on radeonsi. Acked-by: Daniel Stone <daniels@collabora.com> Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Signed-off-by: Qiang Yu <yuq825@gmail.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13868>	2021-11-30 01:58:42 +00:00
Ilia Mirkin	e31d08d307	ci: move windowoverlap exclusion to all-skips The test is just plain not built by our containers. Skip it everywhere. Signed-off-by: Ilia Mirkin <imirkin@alum.mit.edu> Reviewed-by: Emma Anholt <emma@anholt.net> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13919>	2021-11-29 18:08:49 -05:00
Marek Olšák	1df7c0ce7e	radeonsi: print the shader stage for shader-db dumps Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13869>	2021-11-26 11:58:27 +00:00
Marek Olšák	59926f25fa	radeonsi: print source_sha1 as part of shader dumps It's not part of the shader key, but I don't know where else to put it. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13869>	2021-11-26 11:58:27 +00:00
Marek Olšák	cd86f1dc2b	radeonsi: rename si_get_shader_wave_size and make it non-inline Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	676d4ddcf8	radeonsi: centralize wave size computation in si_get_shader_wave_size The big comment was not really true. The other debug options are unused right now, but will be used again in the future. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	b5665bd46c	radeonsi: don't use compute_wave_size directly It will be removed. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	1ef027851d	radeonsi: propagate si_shader::wave_size to VGT_SHADER_STAGES instead of hardcoding them Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	913e1b9138	radeonsi: clean up compute_wave_size use in si_compute_blit.c Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	8290cae2b7	radeonsi: don't use si_get_wave_size in si_get_ir_cache_key Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	d08b09cb7e	radeonsi: use si_shader::wave_size Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	bc57488936	radeonsi: add si_shader::wave_size because it will vary Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	41523773f5	radeonsi: add wave32 flag into prolog/epilog keys It will vary between shaders. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	3b2a6e1b21	radeonsi: don't print uninitialized inlined_uniform_values We don't set them and we don't read them if they are disabled, so don't print them either. This silences valgrind warnings. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13878>	2021-11-26 11:35:05 +00:00
Marek Olšák	cdeecadcb6	radeonsi: deduplicate min_esverts code in gfx10_ngg_calculate_subgroup_info Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13829>	2021-11-20 00:03:45 +00:00
Marek Olšák	9d7ac70ffb	radeonsi: implement shader culling in GS It already does compaction, so we just need to load vertex positions and cull. This was easier than expected. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13829>	2021-11-20 00:03:45 +00:00
Marek Olšák	492a61fe72	radeonsi: don't use ctx.stage outside of si_llvm_translate_nir si_llvm_translate_nir() changes ctx.stage, so the outside code shouldn't use it. This hasn't caused any issues yet. Since ctx.stage starts as 0, the first use in this commit was a tautology. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13829>	2021-11-20 00:03:45 +00:00
Marek Olšák	1c5899900d	radeonsi: simplify si_get_vs_key_outputs for GS ngg_culling is always 0 when GS is enabled. This will change in the future. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13829>	2021-11-20 00:03:45 +00:00
Marek Olšák	a368385b23	radeonsi: add is_gs parameter into si_vs_needs_prolog and disable the VS prolog code for GS. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13829>	2021-11-20 00:03:45 +00:00
Marek Olšák	f96d1757bb	radeonsi: restructure code that declares merged VS-GS and TES-GS SGPRs no change in the SGPR layout Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13829>	2021-11-20 00:03:45 +00:00
Marek Olšák	2418da2d4a	radeonsi: separate culling code from VS/TES (to be reused by GS) Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13829>	2021-11-20 00:03:45 +00:00
Mike Blumenkrantz	c9a47c85da	gallium: rename PIPE_CAP_PREFER_BLIT_BASED_TEXTURE_TRANSFER this is now a bitfield enum for more functionality Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/11984>	2021-11-18 07:58:29 -05:00
Pierre-Eric Pelloux-Prayer	df8aeb4598	radeonsi/sqtt: increase the default buffer size to 32MB Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13838>	2021-11-18 10:53:37 +01:00
Pierre-Eric Pelloux-Prayer	56382ec071	radeonsi: unreference framebuffer state after use util_copy_framebuffer_state increases refcounts, so we have to decrement them afterwards. Fixes: `b1b491cdbb` ("radeonsi: add a faster clear path for glClearTexImage") Closes: https://gitlab.freedesktop.org/mesa/mesa/-/issues/5631 Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13838>	2021-11-18 10:53:34 +01:00
Marek Olšák	ba6d389fa7	radeonsi: don't use GS SGPR6 for the small prim cull info use a user SGPR instead. This will be needed in the future. Also don't upload small_prim_precision because it's passed via VS_STATE_BITS. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13811>	2021-11-16 19:41:07 +00:00
Marek Olšák	0690a44e69	radeonsi: inline declare_vs_specific_input_sgprs I think it was getting a little hard to follow. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13811>	2021-11-16 19:41:07 +00:00
Marek Olšák	513bd6acca	radeonsi: cull against clip planes, clipvertex, clip/cull distances in shader The downside is that this duplicates shader code for clip/cull distances in both the position and parameter portions of the shader. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13811>	2021-11-16 19:41:07 +00:00
Marek Olšák	881c459191	radeonsi: unify how ngg_cull_flags are set Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13811>	2021-11-16 19:41:07 +00:00
Marek Olšák	42dbfd7206	radeonsi: make si_llvm_emit_clipvertex non-static it will be used in culling code Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	d3d5777536	radeonsi: remove an incorrect comment at lds_byte0_accept_flag Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	20e83abf06	radeonsi: improve memory instruction tracking Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	901697654a	radeonsi: add dcc_msaa option to enable DCC for MSAA Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	5a5263d65d	radeonsi: unify GFX9_VSGS_NUM_USER_SGPR and GFX9_TESGS_NUM_USER_SGPR Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	9151ac3531	ac,radeonsi: cull small lines in the shader using the diamond exit rule It also splits clip_half_line_width into X and Y components for tighter view culling. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	701a0b5165	radeonsi: add si_state_rasterizer::ngg_cull_flags_lines and rename the others Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	3166d4428d	radeonsi: set EXTRA_DX_DY_PRECISION for lines where it's supported Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:46 +00:00
Marek Olšák	4571778008	radeonsi: set PERPENDICULAR_ENDCAP_ENA for wide AA lines This is more correct. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:45 +00:00
Marek Olšák	3338956268	radeonsi: make si_get_small_prim_cull_info static Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:45 +00:00
Marek Olšák	963b7475a9	radeonsi: use ac_build_load_to_sgpr in gfx10_emit_ngg_culling_epilogue This is more correct because we are loading constants into an SGPR even though there is no effect on behavior in this case. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:45 +00:00
Marek Olšák	f8a0aa6852	radeonsi: fix view culling for wide lines We need to cull wide lines as quads, but only for view culling. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:45 +00:00
Marek Olšák	8f687bb5dc	radeonsi: fix shader culling with integer pixel centers Only Nine was using them. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13700>	2021-11-16 02:11:45 +00:00
Qiang Yu	3900551894	radeonsi: add radeonsi_force_use_fma32 driconf option fma32 only round once so has 0.5UP accuracy. mad32 round twice so has 1UP accuracy. This accuracy difference sometimes make the result different at the last bit. Applications like META need more accuracy for display right result. Reviewed-by: Marek Olšák <marek.olsak@amd.com> Signed-off-by: Qiang Yu <yuq825@gmail.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13686>	2021-11-12 09:01:58 +00:00
Samuel Pitoiset	3e7bac80ce	ac/rgp: add support for dumping SPM data Signed-off-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13704>	2021-11-11 10:05:49 +00:00
Marek Olšák	3d80d6b696	radeonsi: enable nir_group_loads for better performance The best case I have is one viewperf subtest getting +9% performance. 56979 shaders in 34726 tests Totals: SGPRS: 2667522 -> 2669178 (0.06 %) VGPRS: 1543608 -> 1553472 (0.64 %) Spilled SGPRs: 4090 -> 4100 (0.24 %) Spilled VGPRs: 1600 -> 1791 (11.94 %) Private memory VGPRs: 256 -> 256 (0.00 %) Scratch size: 1872 -> 2076 (10.90 %) dwords per thread Code Size: 59443980 -> 59479804 (0.06 %) bytes Max Waves: 867280 -> 865634 (-0.19 %) Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Reviewed-by: Timur Kristóf <timur.kristof@gmail.com> v2: No change in pixels but the hash changed. Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13604>	2021-11-08 21:20:11 +00:00
Pierre-Eric Pelloux-Prayer	e26dd92957	radeonsi/sqtt: fix FINISH_DONE / BUSY usage They're using more than a single bit so use the proper mask. Based on https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13694 Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13696>	2021-11-08 17:16:11 +00:00
Pierre-Eric Pelloux-Prayer	3de072aaec	radeonsi/sqtt: fix shader stage values shader_stages_mask and others expect MESA_SHADER_* based values, not PIPE_SHADER_*... Without this the fragment shader wouldn't appear in the "Pipelines" pane of RGP. Fixes: `c276bde34a` ("radeonsi/sqtt: export shader code to RGP") Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13696>	2021-11-08 17:16:11 +00:00
Marek Olšák	78337728d1	radeonsi: set correct point and line limits Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13676>	2021-11-08 14:37:49 +00:00
Marek Olšák	cf9afc7b0c	gallium: add missing point and line CAPs The returned values are the same as the GL frontend. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13676>	2021-11-08 14:37:49 +00:00
Marek Olšák	b80dca86c3	gallium: rename PIPE_CAPF_MAX_POINT_WIDTH -> MAX_POINT_SIZE Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13676>	2021-11-08 14:37:49 +00:00
Marek Olšák	74adf22a0a	radeonsi: fix a typo preventing a fast depth-stencil clear Fixes: `9defe8aca9` - radeonsi: implement fast Z/S clears using clear_buffer on HTILE Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13603>	2021-11-04 17:36:26 +00:00
Marek Olšák	c0f723ce2b	radeonsi: allow and finish TC-compatible MSAA HTILE This improves perf for Catia by 4%. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13603>	2021-11-04 17:36:26 +00:00
Marek Olšák	3baeaac64b	radeonsi: rename stencil_cleared_level_mask -> stencil_cleared_level_mask_once Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13603>	2021-11-04 17:36:26 +00:00
Marek Olšák	b1b491cdbb	radeonsi: add a faster clear path for glClearTexImage Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13603>	2021-11-04 17:36:26 +00:00
Marek Olšák	5d3aea49b8	radeonsi: fix 2 issues with depth_cleared_level_mask - Unset depth_cleared_level_mask for non-clear blits. Set the flag after the clear, so that we don't have to check blitter_running. - Set depth_cleared_level_mask only when we set depth_clear_value. Fixes: `ff8a930cf7` - radeonsi: add _once suffix to depth_cleared_level_mask Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13603>	2021-11-04 17:36:26 +00:00
Marek Olšák	6d483fed85	gallium/u_blitter: disable sample shading for all blits Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13602>	2021-11-04 15:06:09 +00:00
Marek Olšák	7ce3f8e639	gallium/util: fix util_can_blit_via_copy_region with unbound render condition It returned false when a render condition was not bound, but it should have returned true. The bool stuff is random and incomplete, but that's life. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13602>	2021-11-04 15:06:09 +00:00
Pierre-Eric Pelloux-Prayer	bc6d22b920	radeonsi: fix ps_uses_fbfetch value si_update_ps_colorbuf0_slot used blitter_running as a way to detect recursive calls. Unfortunately this catch too many cases; for instance a backtrace like: #0 si_update_ps_colorbuf0_slot #1 si_set_framebuffer_state #2 do_blits [...] #5 si_blit #6 si_copy_region_with_blit Would end-up not updating ps_uses_fbfetch; so if the new fb_state is something like: cbufs = {0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0, 0x0}, zsbuf = 0x55b8987545e0} We can have ps_uses_fbfetch=true but cbufs[0] = NULL, which causes a crash later in si_ps_key_update_framebuffer. This commit fixes intermittent crashes in KHR-GL46.stencil_texturing.functional. Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13550>	2021-11-04 09:38:42 +01:00
Pierre-Eric Pelloux-Prayer	d86d602ed0	radeonsi/sdma: fix bogus assert src can use dcc even for non sdma v5 variants because si_decompress_dcc is called in si_sdma_copy_image. Fixes: `46c95047bd` ("radeonsi: implement si_sdma_copy_image for gfx7+") Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13550>	2021-11-04 09:38:41 +01:00
Pierre-Eric Pelloux-Prayer	dc56301f78	radeonsi: treat nir_intrinsic_load_constant as a VMEM operation This is used by variable indexing of constant arrays, to build code like this: s_add_u32 s6, s6, const_data@rel32@lo+4 s_addc_u32 s7, s7, const_data@rel32@hi+12 [...] global_load_dword v4, v4, s[6:7 Closes: https://gitlab.freedesktop.org/mesa/mesa/-/issues/5118 Fixes: `8288882965` ("radeonsi: set MEM_ORDERED optimally") Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13550>	2021-11-04 09:38:20 +01:00
Marek Olšák	81d35c8d48	util: add a util_bitcount variant that selects POPCNT through C++ template arg Moved from radeonsi. st/mesa will use it. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13512>	2021-11-03 23:22:31 +00:00
Emma Anholt	4e28962800	ci: Uprev VK-GL-CTS to 1.2.7.2, and pull in piglit while I'm here. The VK-GL-CTS fixes some issues for freedreno, and almost all of LVP's xfails. Reviewed-by: Tomeu Vizoso <tomeu.vizoso@collabora.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13622>	2021-11-02 20:29:31 +00:00
Marek Olšák	8bfa146b80	radeonsi: print the border color error message only once Cc: 21.2 21.3 <mesa-stable@lists.freedesktop.org> Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13590>	2021-10-29 12:33:55 +00:00
Marek Olšák	c494cfb1dd	radeonsi: don't invoke si_decompress_depth if textures are not dirty at binding This eliminates the overhead of invoking si_decompress_depth. The complication here is that we need to update needs_depth_decompress_mask every time we update dirty_level_mask. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13492>	2021-10-29 07:14:33 +00:00
Marek Olšák	61bd8ec043	gallium/radeon: merge BO read/write usage flags with priority flags Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13478>	2021-10-29 06:54:21 +00:00
Marek Olšák	b5cf0d118c	gallium/radeon: remove/merge some BO priorities and remove holes The upper bits will be used by RADEON_USAGE_* Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13478>	2021-10-29 06:54:21 +00:00
Marek Olšák	f815009036	gallium/radeon: change the BO priority definitions to bits This is for the next microoptimization. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13478>	2021-10-29 06:54:21 +00:00
Marek Olšák	a0f05a5b20	radeonsi: remove unused parameters in si_emit_draw_packets This is a leftover from GS fast launch and compute-based culling. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13539>	2021-10-29 06:33:29 +00:00
Marek Olšák	98f696c972	radeonsi: enable shader culling for indirect draws It was mistakenly disabled, decreasing performance a lot. Only valid for Mesa 21.3. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Cc: 21.3 <mesa-stable@lists.freedesktop.org> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13539>	2021-10-29 06:33:29 +00:00
Emma Anholt	8fb850651c	ci: Enable testing radeonsi's libva using libva-util unit tests. We've noticed issues with these tests when uprevving Mesa in Chrome OS. This CI catches some existing failures, and some debug-build assertion failures as well. To do this, uprev deqp-runner for its new gtest-runner command. This runner is not as efficient as I would hope, due to some expensive code in gtest. I've reported the issue to gtest and it should be easily fixable, but for now it at least means we get to use the same baseline/skip/flake handling we have from deqp and piglit runners. I also fixed build-libdrm for our rootfses to not throw away libdrm's share directory, which was causing a bunch of test-time spam from radeon's libdrm when trying to look up its marketing name tables (not that big of a deal for deqp-runner, but really noisy for piglit and libva-utils which make gallium screens approximatly per-test). Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13419>	2021-10-28 23:17:19 +00:00
Emma Anholt	bfbc41a9fa	ci/piglit-runner: Merge piglit-driver-.txt files into driver-.txt. The test names are definitely unique (deqp has specific prefixes, piglit uses '@' as a separator instead of '.'), so we can just have a single file regardless of test type. Merges the two groups of xfails together so you can't mix up which file to edit (I certainly have), and so that we don't need to introduce yet another set of files when we add gtest for libva. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Acked-By: Mike Blumenkrantz <michael.blumenkrantz@gmail.com> Acked-by: Daniel Stone <daniels@collabora.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13517>	2021-10-27 20:54:11 +00:00
Emma Anholt	38dff02bfb	ci/deqp-runner: Rename the deqp-drivername-.txt files to drivername-.txt We have two testsuites with the same format for fails/flakes/skips files, and test names that are definitely unique. As I'm about to add a third testsuite (gtest for libva-utils), so let's have just one file each for fails/flakes/skips instead of one per type of testsuite. This starts the move with just the bulk rename of deqp. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Acked-By: Mike Blumenkrantz <michael.blumenkrantz@gmail.com> Acked-by: Daniel Stone <daniels@collabora.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13517>	2021-10-27 20:54:11 +00:00
Emma Anholt	60cb471805	ci/radeonsi: Use a deqp-runner suite suite for stoney. This should make it easier to tune the runtime, and enable KHR-GL* tests in the future. (Not done currently because something in KHR-GL* causes oomkiller). This drops the redundant FDO_CI_CONCURRENT settings, since the default on these boards is 4 anyway. Reviewed-by: Tomeu Vizoso <tomeu.vizoso@collabora.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13504>	2021-10-27 09:19:34 -07:00
Emma Anholt	9ddfd297e0	ci/deqp-runner: Simplify the --jobs argument setup. We can use the general "how parallel should we go on this runner?" env var and save a bunch of massaging env var names. Fixes how PIGLIT_PARALLEL looked like it was useful but actually wasn't passed through to HW runners. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Reviewed-by: Tomeu Vizoso <tomeu.vizoso@collabora.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13372>	2021-10-21 07:34:19 +00:00
Marek Olšák	6129db68bf	winsys/amdgpu: remove force_chaining parameter from cs_check_space it's always false Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:30 +00:00
Marek Olšák	9d852a4695	radeonsi: properly destroy buffers on failure Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	0d2dc06761	radeonsi: don't sync before clear_buffer and copy_buffer if the buffer is idle Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	d4cf4b3cee	radeonsi: don't update bind_history for internal buffer clears and copies Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	61ebdcfc29	radeonsi: don't sync PS or CS before (clear\|copy)_buffer based on bind history Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	4bc8c2590e	radeonsi: rebind a buffer only in shader stages where it's been bound Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	13b1424e96	radeonsi: change bind_history to track usage in each shader stage Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	9f2a97e9df	radeonsi: add an option to use CPU storage uploads for threaded context It's only enabled for viewperf for now. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	745ea99484	radeonsi: add SI_MAX_VRAM_MAP_SIZE definition Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13400>	2021-10-19 16:53:29 +00:00
Marek Olšák	3df9d8ed80	gallium/u_threaded: implement pipelined partial buffer uploads using CPU storage This removes resource_copy_region for BufferSubData. Drivers have to opt in to use this. See the comment in the header file. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Reviewed-By: Mike Blumenkrantz <michael.blumenkrantz@gmail.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13399>	2021-10-19 13:12:37 +00:00
Marek Olšák	e65d6f45d2	radeonsi: reorder and don't print patch level DRM version in the renderer string Reviewed-by: Zoltán Böszörményi <zboszor@gmail.com> Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13392>	2021-10-18 18:37:09 +00:00
Marek Olšák	f9d7db0262	ac,radeonsi: print a lowercase codename in the renderer string to make it stand out less Reviewed-by: Zoltán Böszörményi <zboszor@gmail.com> Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13392>	2021-10-18 18:37:09 +00:00
Marek Olšák	cbcdcd42fc	radeonsi: enable shader culling on Navi1x consumer SKUs as well Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13393>	2021-10-18 18:08:59 +00:00
Marek Olšák	8cf802e8ef	radeonsi: replace the GS prolog with a monolithic shader variant It only exists because of the hw bug and is used very rarely. Let's simplify it. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13393>	2021-10-18 18:08:59 +00:00
Marek Olšák	62798d2c1f	radeonsi: don't pass NULL into si_get_nir_shader so that we always have the shader key there Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13393>	2021-10-18 18:08:59 +00:00
Pierre-Eric Pelloux-Prayer	ec2eff8f38	radeonsi: use PIPE_BIND_DRI_PRIME instead of is_dri_blit_image Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13362>	2021-10-18 17:16:53 +02:00
Pierre-Eric Pelloux-Prayer	1863b761a6	radeonsi/gfx10.3: enable SDMA for DRI_PRIME copies Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13362>	2021-10-18 17:16:53 +02:00
Pierre-Eric Pelloux-Prayer	a905072521	radeon_winsys.h: add a parameter to buffer_from_handle Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13362>	2021-10-18 17:16:53 +02:00
Pierre-Eric Pelloux-Prayer	234c69f600	radeonsi: use viewport offset in quant_mode determination Instead of only using the viewport extent. Closes: https://gitlab.freedesktop.org/mesa/mesa/-/issues/5344 Cc: mesa-stable Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13382>	2021-10-18 11:15:54 +00:00
Marek Olšák	885f9b3b75	radeonsi: don't memcmp inlined uniform values if uniform inlining is disabled This uses a C++ template to compute the memcmp size at compile time, which is important for getting inlined memcmp. There are 4 different key sizes now: GE with inlined uniforms: 68 bytes GE without inlined uniforms: 52 bytes PS with inlined uniforms: 28 bytes PS without inlined uniforms: 12 bytes Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13285>	2021-10-16 10:41:51 +00:00
Marek Olšák	8c5a32b5fe	radeonsi: split si_shader_key into ps and ge parts to minimize memcmp overhead ps is for the pixel shader, while ge is for VS, TCS, TES, and GS. si_shader_key: 68 bytes si_shader_key_ge: 68 bytes si_shader_key_ps: 28 bytes The only notable change is that si_shader_select_with_key is changed to a C++ template. Other changes are trivial. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13285>	2021-10-16 10:41:51 +00:00
Marek Olšák	385c9e1caf	radeonsi: si_state_shaders.c -> cpp We'll add some templates here. Why is `extern "C"` not needed for exported functions? Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13285>	2021-10-16 10:41:51 +00:00
Emma Anholt	4721352f97	radeonsi: Fix leak of screen->perfcounters. A refactor dropped one of the frees. Fixes: `380ac28891` ("ac: import performance counters from RadeonSI") Reviewed-by: Marek Olšák <marek.olsak@amd.com> Reviewed-by: Samuel Pitoiset <samuel.pitoiset@gmail.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13322>	2021-10-13 11:01:19 +00:00
Yipeng Chen (Jasber)	33484a327e	radeonsi: do not use staging texture for APU This is to fix serious performance drop of texture_upload/ texture_resue relative items in chromeos glbench test. Staging texture is not efficient for CPU uploading. Signed-off-by: Jasber Chen <yipeng.chen@amd.com> Reviewed-by: Marek Olšák <marek.olsak@amd.com> Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13306>	2021-10-13 10:45:04 +00:00
Marek Olšák	80efe661d7	radeonsi: simplify write_psize code in si_get_vs_out_cntl Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12789>	2021-10-13 10:28:14 +00:00
Marek Olšák	824d9bed4f	radeonsi: simplify how VS_OUT_CCDIST is set Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12789>	2021-10-13 10:28:14 +00:00
Arvind Yadav	8f9945a75b	radeonsi: remove the use of PKT3_CONTEXT_REG_RMW This patch is to to remove PKT3_CONTEXT_REG_RMW from radeonsi. and avoid multiple command buffer(PM4 packet)creation for R_02881C_PA_CL_VS_OUT_CNTL. Reviewed-by: Marek Olšák <marek.olsak@amd.com> Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Signed-off-by: Arvind Yadav <arvind.yadav@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12789>	2021-10-13 10:28:14 +00:00
Marek Olšák	b378d6c5db	radeonsi: fix an out-of-bounds access in si_create_vertex_state Fixes: `fb8f532ea1` - radeonsi: implement draw_vertex_state for lower display list overhead Closes: https://gitlab.freedesktop.org/mesa/mesa/-/issues/5484 Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Reviewed-by: Dave Airlie <airlied@redhat.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13309>	2021-10-13 03:57:30 +00:00
Marek Olšák	c85ce2531e	radeonsi: align pipe_resource & sampler_view allocations to a cache line It eliminates "False Sharing" for atomic operations. (see wikipedia) Reviewed-By: Mike Blumenkrantz <michael.blumenkrantz@gmail.com> Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/11618>	2021-10-13 03:26:20 +00:00
Emma Anholt	62949e7519	ci: Update piglit to 7d7dd2688c214e1b3c00f37226500cbec4a58efb. This brings in a bunch of i915g spurious fail fixes, fixes for !12613, and new tests. Reviewed-by: Adam Jackson <ajax@redhat.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13253>	2021-10-13 00:37:59 +00:00
Joshua Ashton	baff748cb0	radeonsi: Check if modifier supports the image extent DCN only supports an extent < 4K on !64B && 128B. Signed-off-by: Joshua Ashton <joshua@froggi.es> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13056>	2021-10-11 11:43:39 +00:00
Marek Olšák	844f66bf38	radeonsi: remove GS fast launch It regresses the first snx test because it adds CPU overhead, and there is no way to work around it. The average effect on viewperf is 0, meaning that a few cases improve, while a few others regress. Acked-by: Timur Kristóf <timur.kristof@gmail.com> Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13279>	2021-10-11 07:13:48 +00:00
Marek Olšák	86a33569f4	radeonsi: add back a workaround for DCC MSAA on gfx9 due to conformance issues Fixes: `8b95f51ef1` - radeonsi: fix and enable full DCC with MSAA 2x on gfx9 Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13256>	2021-10-11 02:10:10 +00:00
Marek Olšák	65a8b50b7a	radeonsi: remove duplicate partial_count variable "count" is computed identically. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13235>	2021-10-08 02:31:30 +00:00
Marek Olšák	50e40365c4	radeonsi: fix a leak in draw_vertex_state if threaded_context is disabled Fixes: `fb8f532ea1` - radeonsi: implement draw_vertex_state for lower display list overhead Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13235>	2021-10-08 02:31:30 +00:00
Rob Clark	1c1c43fbab	gallium/u_threaded: Split out options struct Rather than having an ever increasing list of parameters to threaded_context_create(), split out a struct for optional flags and parameters. This should reduce churn in adding new options. Signed-off-by: Rob Clark <robdclark@chromium.org> Reviewed-By: Mike Blumenkrantz <michael.blumenkrantz@gmail.com> Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13207>	2021-10-07 17:32:25 +00:00
Pierre-Eric Pelloux-Prayer	a1dea665d0	radeonsi: make the DRI_PRIME dGPU -> iGPU copy async Doing this copy using SDMA frees up the dGPU to do more interesting things while the copy is happening; for instance the rendering of the next frame. hw queue activity before: ------------------------ dGPU: gfx: [renderframe 1][copy->iGPU][renderframe 2][copy->iGPU]... iGPU: gfx: [Xorg] [Xorg] hw queue activity before after: ------------------------------ dGPU: gfx: [renderframe 1][renderframe 2][renderframe 3].... sdma: [copy->iGPU] [copy->iGPU] [copy->iGPU] iGPU: gfx: [Xorg] [Xorg] ... If SDMA isn't available or can't do the copy, use an async compute context instead. Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12763>	2021-10-07 09:21:05 +00:00
Pierre-Eric Pelloux-Prayer	f895dc04a5	radeonsi: add an async compute context It'll be used exclusively for DRI_PRIME copies for now. Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12763>	2021-10-07 09:21:05 +00:00
Pierre-Eric Pelloux-Prayer	46c95047bd	radeonsi: implement si_sdma_copy_image for gfx7+ SDMA support was dropped in `1f31a21664` mainly because the advantages of delegating some copy/clear operations to the SDMA hw came with large drawbacks: CPU overhead due to the sdma/gfx synchronization and hangs. This commit restores SDMA support for all gfx7+ chips but only for the image copy operations. SDMA operations won't be intertwined with gfx operations like before. Instead, a SDMA IB will contain a single copy at a time and the synchronization will be handled by the winsys (based on the used buffers). Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12763>	2021-10-07 09:21:05 +00:00
Rob Clark	75808934f8	gallium/u_threaded: Get reset status without sync GPU hangs are asynchronous already, there should not be an expectation that this is synchronized with driver thread. Signed-off-by: Rob Clark <robdclark@chromium.org> Mike Blumenkrantz <michael.blumenkrantz@gmail.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13163>	2021-10-04 19:45:28 +00:00
Pierre-Eric Pelloux-Prayer	dfa4a85ddf	radeonsi: don't clear G_028644_OFFSET Before `11d1309d82` this field was updated even when G_028644_PT_SPRITE_TEX was 0. See https://gitlab.freedesktop.org/mesa/mesa/-/issues/5423 Fixes: `11d1309d82` ("radeonsi: restructure si_get_ps_input_cntl for future refactoring") Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13105>	2021-10-04 08:04:37 +00:00
Joshua Ashton	e76956b9e0	radeonsi: Use common DCC image store check We need to keep RADV and RadeonSI on the same page about this due to modifiers. Signed-off-by: Joshua Ashton <joshua@froggi.es> Reviewed-by: Bas Nieuwenhuizen <bas@basnieuwenhuizen.nl> Reviewed-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13153>	2021-10-02 22:56:48 +00:00
Marek Olšák	fb8f532ea1	radeonsi: implement draw_vertex_state for lower display list overhead Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13050>	2021-10-01 14:51:23 +00:00
Marek Olšák	73f7142ace	radeonsi: separate VBO descriptor code into a new function (for future work) Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13050>	2021-10-01 14:51:23 +00:00
Pierre-Eric Pelloux-Prayer	d17e752857	radeonsi: disable PIPE_CAP_PREFER_BACK_BUFFER_REUSE With https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12763, the DRI_PRIME dGPU -> iGPU copy will be done by the SDMA hw. Since it's asynchronous, it's better to always use at least 2 back buffers to get the next frame rendering started during the copy. Reviewed-by: Marek Olšák <marek.olsak@amd.com> Acked-by: Michel Dänzer <mdaenzer@redhat.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12788>	2021-09-29 08:14:57 +00:00
Marek Olšák	049c366378	radeonsi: don't set DX10_DIAMOND_TEST_ENA for better performance Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13093>	2021-09-28 19:34:07 -04:00
Marek Olšák	f00d3e2909	radeonsi: implement shader-based culling for lines This helps some viewperf subtests. Only view XY culling is done. Edgeflags are always disabled with lines. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	e7e0b90c94	ac/llvm: rename ac_cull_triangle -> ac_cull_primitive Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	0030bdf9a6	radeonsi: add gfx10 helpers for determining whether edgeflags are enabled They will return false when culling lines. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	6058b7381e	radeonsi: always use the correct number of vertices in NGG shader code This is always 3 now, but it will be 2 for lines. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	ccbd551192	radeonsi: disallow NGG fast launch on Navi1x because VGT_FLUSH makes it slower This improves viewperf performance on Navi1x. All Navi1x fast launch workarounds are removed and all fast launch codepaths are disabled. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	b1cf504f78	radeonsi: fix clearing index_size for NGG fast launch Cc: 21.1 21.2 <mesa-stable@lists.freedesktop.org> Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	e40bd61588	radeonsi: strenthen the ngg->legacy hw workaround, fix fast launch hangs too Cc: 20.1 20.2 <mesa-stable@lists.freedesktop.org> Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	1f445e76ae	radeonsi: don't check ngg_culling != 0 for fast launch because it's tautology Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	678b6cdc8b	radeonsi: clean prefer_mono for the blit VS This was missed when I was reworking shader key updates. Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	73b036306c	radeonsi: reduce NGG culling on/off transitions by keeping it enabled When it's enabled, it stays enabled until the next shader change or an incompatible primitive type, etc. This improves performance for viewperf/snx. Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	d7b0ddbfa8	radeonsi: use the optimal draw packet sequence for VGT_FLUSH Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	a927a2f527	radeonsi: set vs_uses_base_instance using C++ template arguments Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	ca37d4c925	radeonsi: decrease vertex count threshold for shader culling to 128 to match radv Reviewed-by: Timur Kristóf <timur.kristof@gmail.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	465f249ec8	radeonsi: change the units of oversub_pc_factor to integer multiples of 1/4 to match radv Reviewed-by: Timur Kristóf <timur.kristof@gmail.com> Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Marek Olšák	4cb008719c	radeonsi: fix a depth texturing performance regression on gfx6-7 Fixes: `0580d4c1` "radeonsi: enable HTILE with mipmapping on gfx9+" Closes: https://gitlab.freedesktop.org/mesa/mesa/-/issues/5398 Acked-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13048>	2021-09-28 17:30:06 +00:00
Pierre-Eric Pelloux-Prayer	7594d4ae2c	radeonsi/test: add sanity checks Verify that DISPLAY is there and deqp-runner is at least 0.9. Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13021>	2021-09-28 11:10:48 +00:00
Pierre-Eric Pelloux-Prayer	bf5cd4c48a	radeonsi/test: add Raven expected results Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13021>	2021-09-28 11:10:48 +00:00
Pierre-Eric Pelloux-Prayer	0afd9e272e	radeonsi/test: add --gpu to select the GPU to test And specify DRI_PRIME + WAFFLE_GBM_DEVICE to avoid testing the wrong GPU. Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13021>	2021-09-28 11:10:48 +00:00
Pierre-Eric Pelloux-Prayer	814e98c3a0	radeonsi/test: sanitize output_folder Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13021>	2021-09-28 11:10:48 +00:00
Pierre-Eric Pelloux-Prayer	ff8edcf903	radeonsi/test: allow to specify a baseline folder Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13021>	2021-09-28 11:10:48 +00:00
Pierre-Eric Pelloux-Prayer	1248c4728a	radeonsi/test: print default values in help Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13021>	2021-09-28 11:10:48 +00:00
Marek Olšák	67bda8dc5f	radeonsi: remove the unused cs parameter from remaining packet functions Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13015>	2021-09-25 08:32:03 +00:00
Marek Olšák	0763bfdb95	radeonsi: remove the unused cs parameter from radeon_set_uconfig_reg Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13015>	2021-09-25 08:32:03 +00:00
Marek Olšák	f4ece6cf12	radeonsi: remove the unused cs parameter from radeon_set_sh_reg Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13015>	2021-09-25 08:32:03 +00:00
Marek Olšák	8b52fd28c3	radeonsi: remove the unused cs parameter from radeon_set_(config\|context)_reg Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13015>	2021-09-25 08:32:03 +00:00
Marek Olšák	9f0cd15d6a	radeonsi: remove the unused cs parameter from radeon_emit_array Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13015>	2021-09-25 08:32:03 +00:00
Marek Olšák	57bb89fdc5	radeonsi: remove the unused cs parameter from radeon_emit Reviewed-by: Pierre-Eric Pelloux-Prayer <pierre-eric.pelloux-prayer@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/13015>	2021-09-25 08:32:03 +00:00
Pierre-Eric Pelloux-Prayer	7405b7fbcd	radeonsi/test: use -t for deqp tests deqp-runner added support for this. Acked-by: Marek Olšák <marek.olsak@amd.com> Part-of: <https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/12899>	2021-09-21 08:37:57 +00:00

1 2 3 4 5 ...

5741 Commits